AI 快讯400家报纸围攻OpenAI:地方新闻的生死之战
行业快讯

400家报纸围攻OpenAI:地方新闻的生死之战

2026-06-26T08:07:46.818Z
400家报纸围攻OpenAI:地方新闻的生死之战

近400家美国地方报纸联合起诉OpenAI和微软,指控其未经授权抓取新闻内容训练AI模型,这是迄今为止规模最大的媒体联合维权行动,可能重塑AI行业的版权边界。

400家报纸围攻OpenAI:地方新闻的生死之战

近400家美国地方报纸本周三联合向纽约南区联邦法院提起诉讼,指控OpenAI和微软未经授权抓取其网站内容训练ChatGPT和Copilot。这是迄今为止针对AI公司版权侵权问题规模最大的媒体联合行动。

原告方称这波AI热潮可能成为地方新闻业的"丧钟"。这话听着耸动,但背后的逻辑很清晰:如果AI公司可以免费拿走几十年积累的原创报道来训练模型、创造数十亿美元市值,而内容生产者"1分钱都拿不到",那谁还会继续投入资源做原创新闻?

诉讼核心:系统性"白嫖"还是合理使用?

根据6月24日公示的法院文件,原告方指控OpenAI和微软存在以下行为:

  • 系统性爬取:被告"秘密地"爬取出版商网站,包括付费墙后的受限内容
  • 未经授权复制:将文章、报道和其他原创作品复制到自己的服务器用于模型训练
  • 删除版权信息:故意剥夺作品中的版权管理信息,包括作者署名、版权声明和使用条款

诉讼同时涉及《版权法》侵权和违反《数字千年版权法》(DMCA)两项指控。原告要求获得法定损害赔偿及禁令救济。

代表原告的新泽西州前总检察长马修·普拉特金在接受采访时表示,这是"地方和区域报纸发起的最大规模法律行动"。他的律所Platkin LLP今年刚成立,显然瞄准的就是AI版权这块新战场。

OpenAI发言人Drew Pusateri的回应则是老调重弹:"我们的模型赋能创新,训练所用数据来自公开可获得的数据,并以合理使用为基础。"

微软方面暂未回应。

"合理使用"还能撑多久?

OpenAI的"合理使用"(Fair Use)抗辩策略已经用了很多次,但在法律层面从未真正被检验过。

所谓合理使用,是美国版权法中的一个例外条款,允许在特定情况下(如评论、教学、新闻报道)未经许可使用受版权保护的作品。判断标准包括四个要素:使用目的和性质、作品性质、使用部分占原作比例、对原作市场的影响。

问题在于,AI训练场景和传统的"合理使用"情形差异巨大:

  1. 使用规模:传统合理使用通常涉及有限的引用,而AI训练动辄抓取数百万篇文章
  2. 商业目的:OpenAI估值已超千亿美元,这显然不是非营利的学术研究
  3. 市场替代:AI生成的内容可能直接与原创新闻竞争,抢走流量和广告收入

Sam Altman自己在英国上议院作证时承认,如果不使用受版权保护的材料,今天的顶尖AI模型将"无法训练"。这句话被写进了本次诉讼的起诉书——原告律师显然很懂如何利用对方的"自认"。

地方报纸:AI时代的弱势群体

这次诉讼的原告构成值得关注。不是《纽约时报》《华尔街日报》这样的全国性大报,而是近400家地方和区域报纸。

地方报纸的处境比大型媒体更加脆弱:

  • 预算有限:很多地方报纸的年度预算可能还不如OpenAI一天的GPU租金
  • 人员精简:通常只有几名到十几名记者,覆盖市政会议、学校、法院、公共安全等本地事务
  • 营收依赖广告:数字化转型本就艰难,AI搜索进一步分流流量
  • 不可替代性:AI无法派记者去参加社区会议、调查本地腐败、发布讣告

普拉特金说得很直接:"人工智能系统无法对市政会议和社区会议进行深入评估,它们无法调查当地犯罪和腐败,无法发布讣告,也无法报道市中心新餐厅的开业。地方记者做到了这一点。"

这不是在反对AI创新,而是在问一个根本问题:AI的繁荣是否必须建立在内容生产者的消亡之上?

从《纽约时报》到400家地方报纸:媒体反击战升级

这场诉讼不是孤立事件,而是媒体行业对AI公司发起反击的最新一环。

时间线回顾

2023年12月:《纽约时报》率先起诉OpenAI和微软,指控两家公司未经许可使用数百万篇文章训练AI模型。这是第一家对OpenAI提起版权诉讼的主流媒体。

2024年2月:数字媒体The Intercept、Raw Story和AlterNet加入诉讼行列,指控OpenAI"搭便车"使用其新闻报道。

2024年同期:《大英百科全书》对OpenAI提起版权侵权诉讼。

2024年:8家报纸联合起诉OpenAI和微软。

2026年6月:近400家地方报纸组成的联盟发起诉讼,规模空前。

可以看到,诉讼主体正在从个别大媒体扩展到整个行业,从全国性媒体下沉到地方媒体。这说明版权问题已经触及整个新闻行业的生存根基。

已达成协议的另一条路

并非所有媒体都选择了对抗。美联社早在2023年7月就与OpenAI达成了许可协议,德国媒体巨头斯普林格集团也走了合作路线。

但协议条款从未公开,外界无从知道这些"合作"对内容方是否公平。而且,有能力与OpenAI坐下来谈判的,通常是那些有议价能力的大型媒体。对于资源有限的地方报纸来说,集体诉讼可能是唯一可行的选择。

技术与法律的碰撞:几个关键问题

1. "公开可获得"等于"可以随便用"吗?

OpenAI的标准回应是训练数据"来自公开可获得的数据"。但"公开可获得"和"可以免费商用"是两回事。你能在网上免费看到一篇文章,不代表你可以把它复制到自己的服务器上用来训练商业产品。

更何况,诉讼指控OpenAI甚至爬取了付费墙后的内容。

2. AI输出能否"洗白"版权问题?

AI公司的一个潜在抗辩是:模型输出的内容与训练数据不同,因此不构成侵权。但这个论点有明显漏洞——《纽约时报》的诉讼中就展示了ChatGPT几乎逐字复现其文章的案例。

而且,即便输出不完全相同,训练过程中的复制行为本身可能就已经构成侵权。

3. 如何证明"因果关系"?

诉讼的一个技术难点是:如何证明特定文章被用于训练?AI公司通常不公开训练数据集的完整内容。

《纽约时报》的做法是通过prompt工程让ChatGPT输出与原文高度相似的内容,以此作为间接证据。OpenAI则反驳说这是"黑客行为"。这个证据争议本身可能就会成为后续案件的焦点。

判决可能带来的行业影响

无论最终结果如何,这场诉讼都可能重塑AI行业的游戏规则。

如果原告胜诉:

  • 授权成本飙升:AI公司将不得不与内容方签订付费协议,训练成本大幅上升
  • 数据合规门槛提高:未来的模型训练需要更严格的数据溯源和授权管理
  • 小型AI公司受冲击:只有资金雄厚的大公司才能承担高额授权费用
  • 可能催生数据交易市场:出现专门撮合AI公司和内容方的中介平台

如果被告胜诉(合理使用成立):

  • 确立AI训练的法律先例:其他内容方的维权空间被大幅压缩
  • 媒体行业雪上加霜:失去通过版权获得补偿的可能性
  • 可能引发立法博弈:媒体行业转向游说国会修改版权法

更可能的中间结果:

  • 和解并签订协议:参考美联社和斯普林格的先例
  • 建立行业规范:形成类似音乐行业ASCAP/BMI的版税分配机制
  • 推动AI公司主动合规:为避免诉讼风险,提前签订授权协议

开发者视角:这场官司和你有什么关系?

如果你是调用GPT、Claude等模型API的开发者,这场诉讼可能不会直接影响你的日常开发。但有几点值得关注:

模型能力边界可能变化

如果AI公司被迫收缩训练数据范围,未来模型在特定领域(如新闻、文学)的表现可能下降。已经有开发者反馈,某些模型在涉及最新新闻时会刻意"装傻",这可能与版权规避策略有关。

企业用户的合规风险

如果你在开发面向企业的AI应用,客户可能会问:你用的模型训练数据合规吗?出了版权问题谁担责?这些问题目前没有标准答案,但随着诉讼案件增多,合规审查会越来越严格。

RAG架构的重要性上升

相比依赖模型的内置知识,使用RAG(检索增强生成)架构接入合规数据源可能变得更加重要。这样至少可以明确知识来源,降低版权风险。

这不只是钱的问题

表面上看,这场诉讼是关于"AI公司该不该为训练数据付费"。但更深层的问题是:在AI时代,原创内容的价值如何被认可和保护?

地方新闻的价值不在于它能产生多少广告收入,而在于它是社区民主运作的基础设施。没有地方记者,就没有对本地政府的监督,没有社区事件的记录,没有邻里之间的信息纽带。

如果AI可以无偿吸收这些内容来增强自己的能力,却不向内容生产者提供任何回报,最终的结果可能是:AI变得越来越"聪明",而支撑这种聪明的原创内容却越来越少。

这是一个典型的公地悲剧。

写在最后

这场诉讼的最终结果可能要等上几年。但它提出的问题——AI创新与版权保护如何平衡——已经成为整个行业必须面对的核心议题。

对于AI公司来说,"先用了再说"的野蛮生长阶段可能正在结束。对于内容创作者来说,这可能是争取自身权益的最后窗口期。

无论你站在哪一边,都值得关注这场官司的进展。它的结果,可能会决定未来十年AI与内容产业的关系走向。


参考来源:

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: