此为历史版本和 IPFS 入口查阅区,回到作品页
討厭鬼 aka 劉維人
IPFS 指纹 这是什么

作品指纹
写入中…

生成式人工智慧時代的內容治理:授權、溯源、基礎設施、出版商能動性

討厭鬼 aka 劉維人
·
·

260517 v.0.1
by 劉維人 feat. chat GPT

執行摘要

內容治理在生成式人工智慧時代的核心問題,已超越著作權的侵害,而是出版商是否仍保有對內容存取、重製、再呈現、標示、計量與救濟的實際能動性。近兩年的產業與政策發展顯示,出版商面對的威脅,已橫跨資料蒐集、模型訓練、檢索增強生成、搜尋介面、零點擊流量轉移、錯誤引用、來源偽冒與市場支配的多層風險。SPUR 的成立、DPCMO 與 EPC 的法律與競爭法行動、News/Media Alliance 的政策動員、以及日本新聞協會對 robots.txt 與 user agent 揭露的要求,都反映出這場競逐已從單純內容授權,擴展為跨模型、跨制度、跨基礎設施的治理重組。

本文主張,單一治理工具不足以回復出版商能動性。雙邊授權可創造收入,但覆蓋面窄、談判力高度不對稱;robots.txt 能表達拒絕意圖,但本身可執行性低;Cloudflare 之類的邊緣基礎設施將原本自律性的指示轉化為可觀測、可選擇阻擋、甚至可付費通行的技術控制點;C2PA 與 OP-CIP 可加強內容與出處辨識,但不能直接解決訓練資料授權、付費與流量分配。真正有效的治理,需要整個治理堆疊的組合設計

其次,區域差異將決定出版商能動性的制度輪廓。美國目前以訴訟、雙邊商業授權、産業遊說為主;歐洲則結合《數位單一市場指令》的文本與資料探勘例外/保留權、出版社鄰接權、競爭法與集體管理組織;日本則同時走向 robots.txt 的法規化效力、user agent 揭露、RAG 使用界線,以及 Originator Profile 這類身份與來源驗證基礎設施。這些差異,表示「新聞內容治理」不能只從 copyright doctrine 分析;它更接近數位基礎設施治理與市場設計問題

業界目前的SPUR、Cloudflare、C2PA 、OP-CIP 等方法,雖然並未解決問題,但各自占據了不同控制點。SPUR 試圖降低授權摩擦、建立計量與共通標準;Cloudflare 把 crawl control 從網站主的弱訊號提升為網路邊界上的交易與阻擋機制;C2PA 將內容來歷、編修歷程與 AI 參與資訊制度化;OP-CIP 則試圖把「誰是可信發布者」嵌入可驗證憑證與第三方驗證流程。這些工具彼此互補,且將深刻影響未來新聞業能否在 AI 供應鏈中保有談判位置。

因此本文建議,為切合政策價值與潛在發展爭點,相關研究的問題意識不應設定為「AI 對新聞的衝擊」,而應聚焦為:在生成式 AI 內容供應鏈中,哪些制度與技術安排真正增加了出版商的可選擇性、可見度、可執行性與可救濟性

關鍵詞

生成式人工智慧;內容治理;出版者能動性;授權;內容溯源

引言與研究方法

引言

過去新聞業與平台之間的權力衝突,多聚焦於搜尋引擎與社群平台如何中介流量;生成式 AI 則把衝突進一步推向內容直接萃取、重組與輸出。Tow Center 的研究顯示,AI 搜尋工具不僅經常錯誤引用,還會捏造連結、誤指原始出處,甚至在 publisher 已封鎖爬蟲時仍能回應相關內容;這意味著新聞業面對的不是單純「被抓走多少內容」,而是「誰定義內容如何進入模型與回答介面」的權力位移[17, 18]。

這也是 SPUR 最值得注意之處。SPUR 並未把問題界定成單一侵權糾紛,而是將其描述為缺乏共同技術標準、授權框架、計量工具與透明使用通道的系統性市場失靈。其公開任務明確包括:建立共通標準、降低授權摩擦、支持保護智慧財產的技術工具、確保高價值內容透過 rights-cleared 與 accountable channels 存取,以及推動透明、可擴張的新聞內容使用[31]。這使 SPUR 成為目前最接近「產業治理編排者」的出版商聯盟之一。

另一方面,基礎設施提供者正在從中立傳輸角色轉向治理節點。Cloudflare 的 AI Crawl Control 讓網站主得以監測 AI crawler 活動、依 crawler 個別阻擋、觀察 robots.txt 遵循情況,並在 pay-per-crawl 機制下對 AI crawler 發出 402 Payment Required 要求[3, 4, 5]。這意味著治理不再只是法律主張,而是被嵌入網路邊界層的技術執行。

因此,本文的研究問題設定如下:第一,生成式 AI 對新聞內容造成的衝擊應如何分解為可治理的威脅模型;第二,授權、溯源、邊緣基礎設施與公共法規範如何形塑「出版商能動性」;第三,美國、歐洲與日本分別走向何種制度組合;第四,哪些聯盟、基礎設施與標準最可能在未來三到五年成為關鍵控制點。

方法

本文採用 scoping review + grey literature review。納入材料包含:標準與技術規格(RSL、C2PA、OP-CIP、Cloudflare 文件)、產業聯盟與官方聲明(SPUR、News/Media Alliance、JNPA)、法院與監管文件(NYT v. OpenAI 的 docket、DPCMO 聲明、EPC 對 Google 的競爭法申訴、法國競爭機關就 Google/Bard 的裁罰)、主要新聞組織新聞稿(AP、FT、Guardian、Le Monde、News Corp),以及 Reuters Institute 和 Tow Center 的研究型報導。[1, 2, 3, 7, 8, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 23, 29, 30, 31, 32, 33]。檢索範圍以 2023 年至 2026 年 5 月 17 日為主。

此方法會受到許多限制。第一,多數商業授權的具體金額、資料範圍、輸出使用條款與稽核機制並未公開,因此本文無法對授權的實際經濟效果做量化比較。第二,流量損失、模型使用量、來源點擊率、回答展示規則常屬平台內部資料;本文只能依公開研究與官方文件進行比較。第三,訴訟結果仍在演進,任何對長期判例效應的推論都只能是條件式推論,而非既成結論。

核心一手資料優先序

理論框架與威脅模型

理論框架

本文提出一個 AI content governance stack,把新聞內容治理視為多層堆疊,而非單一法域問題。這個堆疊的下層是內容與出處,上層是模型與介面,外層則是法律與市場結構;出版商能動性取決於其能否在多層控制點上同時建立選擇權。這個框架與 SPUR 強調的「standards、licensing、measurement、infrastructure」高度一致,也與歐盟將 TDM 保留權設計為 machine-readable reservation 的方向相呼應[12, 31]。

圖 1 AI 內容治理堆疊

出處與身分層解決的是「誰」與「是否被竄改」,邊緣執行層解決的是「能否進來」與「以什麼條件進來」,法律與競爭法則處理「若無視條件,如何追索」

威脅模型

價值鏈時間軸

圖 2 新聞內容在生成式 AI 價值鏈中的控制點

治理機制若只部署在鏈條末端,通常已經太晚。USCO 對 opt-out 的討論與多家出版商的訴訟,都反覆指出:一旦作品已被吸收進訓練與索引流程,後續移除與補救在技術與證據上都更困難。[25, 26, 27, 32, 33]。未來研究必須把 focus 從「copyright after the fact」移向「control before and during ingestion」。

治理回應與區域比較

治理回應

SPUR 作為聯盟型治理模型

SPUR 最重要的地方,不是它是一個「反 AI」聯盟,而是它把新聞業的訴求翻譯成可以與 AI 平台交易的規則、標準與基礎設施語言。 SPUR 的高頻核心語彙包括:technical standards、licensing frameworks、reduce friction、measurement tools、rights-cleared、accountable channels、transparent、scalable use、infrastructure31]。這套語彙把抵抗未授權使用的主張,轉化為一種「可市場化、可機器可讀、可計量」的治理設計。

SPUR 把 publisher rights 問題重新定義為一個協調型基礎設施問題。它不只是 lobbying,也不只是 collective bargaining;它更像試圖建立一個面向 AI 平台的 publisher protocol layer。這是它與單純廣告倡議或個別授權協議最大的差別。

雙邊授權與私法化治理

目前最常見的產業回應是雙邊授權。AP 在 2023 年與 OpenAI 達成內容與技術合作;FT 在 2024 年宣布與 OpenAI 的授權與產品合作,強調 attributed content 與協力開發讀者功能;Le Monde 與 OpenAI 的多年度合作同時涵蓋模型使用、ChatGPT 答案可見性與多年度收入;Guardian Media Group 則在 2025 年將 Guardian 報導與 archive 提供給 ChatGPT,並部署 ChatGPT Enterprise 開發新工具[1, 13, 14, 19]。這些案例顯示,主要出版商正從單純防禦,轉向選擇性合作 + 內部工具採用的路徑。

然而,這種路徑並非穩定解方。Tow Center 對 ChatGPT Search 的研究指出,即使出版商允許 crawler 或與 OpenAI 有合作關係,系統仍可能大量錯引、誤引甚至錯誤表徵其內容;授權協議並不自動帶來輸出正確性、品牌一致性或穩定點擊回流[17]。雙邊授權處理的是 access 與 revenue 的一部分,但不處理 representation 與 accountability 的核心難題。

News Corp 代表另一種更露骨的市場化姿態。其與 OpenAI 在 2024 年簽署全球多年度合作,允許 OpenAI 顯示 News Corp 眾多媒體內容並改進產品;Robert Thomson 在 2026 年則公開表述「woo and sue」邏輯:願意合作,但若未付費抓取則會訴訟[15, 20]。這種做法凸顯大型媒體集團的雙重策略:一方面把高品質新聞定位為 AI 的關鍵投入品,另一方面把訴訟作為壓低對方機會主義的談判籌碼。

基礎設施治理與機器可讀授權

Cloudflare 把原本被視為「君子協定」的 crawl preference,提升為網路邊界層上的可執行政策。官方文件顯示,AI Crawl Control 可監測 AI 服務存取內容的方式、依個別 crawler 設定 allow/block 規則、追蹤 robots.txt 遵循、並讓網站主探索 pay-per-crawl 定價;在 pay-per-crawl 模式下,AI crawler 若未攜帶支付意圖,可收到 402 Payment Required,而 Cloudflare 作為 Merchant of Record 與底層技術提供者。這使其成為目前最接近「從傳輸層介入內容權利治理」的關鍵基礎設施[3, 4, 5, 6]。

但 Cloudflare 的角色也有極限。第一,它主要處理未來的請求,對已被抓取、已被訓練、或由其他資料供應鏈轉手取得的內容,補救有限。第二,它的治理高度仰賴網站位於其基礎設施之上,因此存在對單一私人基礎設施的依賴[3, 4]。第三,其內在邏輯仍偏向「入口管理」,而非輸出責任或模型可稽核性。儘管如此,在現階段的公開工具版圖中,Cloudflare 確實是少數把 robots/consent/payment/observability 串起來的行動者。

RSL 則嘗試把這種治理進一步標準化。RSL 1.0 把授權條件、支付、法律條款與自動化授權機制寫成 XML,可透過 robots.txt 的 License: 指令、HTTP Link header 或 HTML <link> 發現;其設計目標包括機器可讀條款、授權發現、自動授權、付費、稽核證據與大規模合規。它還納入 pay per crawl、pay per inference、attribution-only 等概念[30],代表可以執行條件式授權

溯源、發布者驗證與身份治理

C2PA 與 OP-CIP 常被放在同一欄位,但兩者解決的是不同問題。C2PA 的 Content Credentials 被描述為數位內容的「nutrition label」,以 manifest、claim 與簽章來揭示內容的建立、編修與來源歷程;其採用已被大量公司支持的跨產業技術規格,並已被 Meta、Google、Amazon 等大型平台納入標示與產品路線[7, 8, 9]。它的強項是內容歷史與編修透明度

OP-CIP 的 Originator Profile 則更接近發布者身份與治理狀態的可驗證聲明。官方 FAQ 與技術文件指出,OP 使用 Verifiable Credentials,由可信第三方確認發布者身份、組織政策與治理機制;其目的不是事實查核,而是協助使用者確認「這個內容是否確由該可信發布者發出,且未被竄改」。官方亦明言,OP 與 provenance management 技術是不同角色,可以互補使用[23]。這使 OP 特別適合處理仿冒媒體、災害與金融假消息、品牌偽冒等問題。

然而,溯源與發布者驗證是必要但非充分條件。它們能增加 end-user trust 與平台標示,但不能單獨回覆「模型有無取得使用權」「答案是否應支付回報」「歸屬是否正確」「流量是否被去中介化」等問題。C2PA 與 OP-CIP 是治理堆疊中的identity/provenance layer,不能直接衍伸其他權利治理要件。

訴訟、競爭法與公共法執行

美國案例中,NYT 在 2023 年 12 月對 Microsoft 與 OpenAI 提起訴訟;2025 年法官在相當程度上允許核心著作權請求繼續推進。Dow Jones 與 New York Post 也在 2024 年起訴 Perplexity;Ziff Davis 等出版方隨後加入對 OpenAI 的訴訟序列[25, 26, 27, 32]。這些案件的共同意義,不只是求償,而是在試圖確立:訓練資料蒐集、RAG/answer engine 輸出、與品牌/內容再呈現的法界線究竟落在哪裡。

歐洲的公共法工具更偏向制度。DSM 指令第 4 條允許對 lawfully accessible works 進行 TDM,但前提是權利人未以適當方式保留權利,且對公開線上內容而言,這種保留可以用 machine-readable means 表示;第 15 條則賦予出版社對 press publications 的線上使用保護。EPC 對 Google 的申訴進一步將問題上升為 Article 102 TFEU 的支配地位濫用:Google 一邊掌控一般搜尋流量,一邊以 AI Overviews/AI Mode 重用出版社內容,使 opt-out 形同退出可見性。法國競爭機關對 Google 的 €250m 裁罰,也明確把 Bard/Gemini 使用出版內容納入相關爭議[2, 11, 12, 24, 28]。

丹麥 DPCMO 的案件則揭示出集體管理組織在 AI 時代的角色:它代表 99% 丹麥新聞業,主張 OpenAI 至少使用到 2024 年夏季的丹麥新聞資料,且成員直到 2023 年夏季至少都無法透過 opt-out 拒絕使用,最後因調解失敗而走向訴訟[10]。它試圖以集體代表 + 法律主張 + 調解制度去對抗資訊與議價不對稱。

區域比較

三者相比,美國比較像「以市場交易與訴訟賭判例」,歐洲比較像「以公共法與集體權利重塑談判地形」,日本則更早把治理問題寫進協定層與身份層」

核心行動者、基礎設施與評估矩陣

核心行動者與控制點

根據本次研究所涉資料,未來影響力最強的單位或聯盟包括Cloudflare、SPUR、C2PA、EPC/法國競爭法路徑、DPCMO、日本的 JNPA + OP-CIP。 它們分別占據了執行層、協調層、標示層、公共法層與身份層。其中,Cloudflare 與 C2PA 最可能先成為事實上的市場基礎設施;SPUR 則最可能決定 publisher side 是否能形成對等協調能力。

評估矩陣

下表為本文提出之分析型評估矩陣。分數為低/中/高,屬綜述性評價,可用於協助比較,但不能用來量化排序。

根據這個矩陣,最高可執行性的工具,往往不是最可擴張的工具;最容易部署的工具,也往往不是最能改變權力結構的工具。例如 robots.txt 幾乎零門檻,但可執行性弱;訴訟與競爭法效力高,但成本與進場門檻也高;Cloudflare 與 RSL 的潛力在於其可能於中間地帶建立「足夠可執行、且可規模化」的治理通道。因此本文認為「模型、制度、基礎設施」三者必須一併分析。

討論、政策建議

討論

現有公共討論常把新聞與 AI 的衝突簡化成兩種敘事:一是「AI 需要高品質新聞,所以終將付費」;二是「技術發展太快,法律終將落後」。這兩種說法都過度簡化。前者忽略了平台可以在缺乏穩定回饋機制的情況下先行吸納價值;後者忽略了法律、標準與基礎設施事實上正在快速共同演化。SPUR、Cloudflare、C2PA、DPCMO、EPC、JNPA 都是演化中的治理回應,而不是被動等待法律更新的旁觀者。

更重要的是,出版商面對的不是單一 AI 公司,而是整條供應鏈:dataset builder、foundation model company、answer engine、搜尋平台、邊緣基礎設施、授權中介、甚至 provenance standard body 都可能重塑價值分配。

政策建議

可能方向目的主要對象將 robots.txt 升級為可驗證、可區分用途的權利訊號區分 search、training、RAG、agentic use,避免一禁全禁立法者、標準組織、平台推動 user agent 強制揭露與 crawler 註冊提高可見性與可追責性監管機關、AI 公司建立 publisher-side usage measurement 標準解決授權結算與稽核困難SPUR、CMO、標準組織要求答案引擎輸出可稽核的來源呈現規則降低錯誤引用、提升品牌可見性AI 平台、監管機關鼓勵可擴張的集體授權或 clearinghouse讓中小出版者不必逐一談判政府、CMO、產業聯盟把 C2PA 與發布者驗證納入新聞平台分發規則降低仿冒媒體與合成假新聞傷害平台、新聞業、標準組織對 gatekeeper 搜尋/答案產品啟動競爭法審查處理零點擊與去中介化問題EU、各國競爭主管機關要求大型模型與搜尋平台進行資料來源透明報告補強目前授權與 opt-out 不對稱立法者、監管機關

相關政策的共通原理,是不要把 publisher protection 全部押在單一法律判決或單一商業 deal 上。應該把 permission、identity、visibility、payment、audit 與 remedy 連成一條鏈。舉例來說,Cloudflare 類工具的政策意義在於它把「可選擇的控制」具體化;C2PA 與 OP-CIP 的政策意義則在於,它們使「誰在說話」與「內容怎麼來的」可以從抽象聲明轉為可驗證聲明。

結論

生成式 AI 對新聞業真正構成威脅的,是新聞機構在內容供應鏈中從決定者降格為被動原料供應者。核心概念應從「copyright conflict」提升為「publisher agency across the AI governance stack」。這樣才能含納授權、溯源、邊緣基礎設施、集體代表、競爭法、新聞室實作的各層次影響與能動性。

開放研究問題與方法限制

首先,授權是否真的改善流量、品牌能見度與引用準確性,目前公開證據仍不足;現有資料顯示,授權並不保證正確引用,但長期經濟效果仍缺乏可比資料。其次,訓練資料的 ex post 移除/unlearning 實際可行性,仍多停留在政策爭議與技術主張層次。第三,中小出版者能否進入未來的 clearinghouse 或標準架構,目前仍不確定;若標準由大型平台與大型媒體主導,可能再製新的不平等。第四,OP-CIP 與 C2PA 的實際普及率 與跨平台顯示效果,仍有待後續追蹤。這些都是後續研究最值得投入的問題。

參考文獻

  1. Associated Press. (2023, July 13). AP, Open AI agree to share select news content and technology in new collaboration. www.ap.org/media-cen...

  2. Autorité de la concurrence. (2024, March 20). Related rights: The Autorité fines Google €250 million for non-compliance with some of its commitments made in June 2022. www.autoritedelaconc...

  3. Cloudflare. (n.d.-a). AI Crawl Control. Cloudflare Docs. developers.cloudflar...

  4. Cloudflare. (n.d.-b). Manage AI crawlers. Cloudflare Docs. developers.cloudflar...

  5. Cloudflare. (n.d.-c). What is Pay Per Crawl? Cloudflare Docs. developers.cloudflar...

  6. Cloudflare. (2025, July 1). Introducing pay per crawl: Enabling content owners to charge AI crawlers for access. blog.cloudflare.com/...

  7. Coalition for Content Provenance and Authenticity. (n.d.). Verifying media content sources. c2pa.org/

  8. Coalition for Content Provenance and Authenticity. (2026). C2PA technical specification. spec.c2pa.org/specif...

  9. Content Authenticity Initiative. (n.d.). Content Credentials. contentcredentials.o...

  10. Danske Pressepublikationers Kollektive Forvaltningsorganisation. (2026, February 27). A united Danish media industry takes OpenAI to court. dpcmo.dk/a-united-da...

  11. European Publishers Council. (2026, February 10). European Publishers Council files formal antitrust complaint against Google over AI Overviews and AI Mode. www.epceurope.eu/pos...

  12. European Union. (2019). Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market. Official Journal of the European Union. eur-lex.europa.eu/le...

  13. Financial Times. (2024, April 29). Financial Times announces strategic partnership with OpenAI. aboutus.ft.com/press...

  14. Guardian Media Group. (2025, February 14). Guardian Media Group announces strategic partnership with OpenAI. www.theguardian.com/...

  15. The Guardian. (2026, March 4). News Corp is essentially an AI “input company”, chief executive says. www.theguardian.com/...

  16. Japan Newspaper Publishers & Editors Association. (2025, June 4). Statement on protecting news content in generative AI. www.pressnet.or.jp/s...

  17. Jaźwińska, K., & Chandrasekar, A. (2024, November 27). How ChatGPT Search (mis)represents publisher content. Columbia Journalism Review. www.cjr.org/tow_cent...

  18. Jaźwińska, K., & Chandrasekar, A. (2025, March 6). AI search has a citation problem. Columbia Journalism Review. www.cjr.org/tow_cent...

  19. Le Monde. (2024, March 13). Le Monde and OpenAI sign partnership agreement on artificial intelligence. www.lemonde.fr/en/ab...

  20. News Corp. (2024, May 22). News Corp and OpenAI sign landmark multi-year global partnership. newscorp.com/2024/05...

  21. News/Media Alliance. (2025, April 7). News media publishers run coordinated ad campaign urging Washington to protect content from Big Tech and AI. www.newsmediaallianc...

  22. OpenAI. (2024, March 13). Global news partnerships: Le Monde and Prisa Media. openai.com/index/glo...

  23. Originator Profile Collaborative Innovation Partnership. (n.d.). Originator Profile FAQ. originator-profile.o...

  24. Reuters. (2024a, March 20). Google fined $271 million by France over media publisher dispute. www.reuters.com/tech...

  25. Reuters. (2024b, October 21). Murdoch firms Dow Jones, New York Post sue Perplexity AI. www.reuters.com/lega...

  26. Reuters. (2025a, April 4). Judge explains order for New York Times in OpenAI copyright case. www.reuters.com/lega...

  27. Reuters. (2025b, April 24). Publisher Ziff Davis sues OpenAI for copyright infringement. www.reuters.com/lega...

  28. Reuters. (2026, February 10). Google hit by European publishers’ complaint to EU over AI Overviews. www.reuters.com/worl...

  29. Reuters Institute for the Study of Journalism. (2026, May 19). Inside the news industry’s efforts to join forces to defend its journalism from AI companies. reutersinstitute.pol...

  30. RSL Collective. (2025, December 10). Really Simple Licensing (RSL) 1.0 specification. rslstandard.org/rsl

  31. SPUR Coalition. (2026). The SPUR Coalition. www.spurcoalition.or...

  32. The New York Times Company v. Microsoft Corporation, No. 1:23-cv-11195 (S.D.N.Y. filed Dec. 27, 2023). CourtListener. www.courtlistener.co...

  33. U.S. Copyright Office. (2025). Copyright and artificial intelligence, Part 3: Generative AI training: Pre-publication version. www.copyright.gov/ai...

CC BY-NC-ND 4.0 授权