近400家美国地方报纸联合起诉OpenAI和微软，指控其未经授权抓取新闻内容训练AI模型，这是迄今为止规模最大的媒体联合维权行动，可能重塑AI行业的版权边界。

400家报纸围攻OpenAI：地方新闻的生死之战

近400家美国地方报纸本周三联合向纽约南区联邦法院提起诉讼，指控OpenAI和微软未经授权抓取其网站内容训练ChatGPT和Copilot。这是迄今为止针对AI公司版权侵权问题规模最大的媒体联合行动。

原告方称这波AI热潮可能成为地方新闻业的"丧钟"。这话听着耸动，但背后的逻辑很清晰：如果AI公司可以免费拿走几十年积累的原创报道来训练模型、创造数十亿美元市值，而内容生产者"1分钱都拿不到"，那谁还会继续投入资源做原创新闻？

诉讼核心：系统性"白嫖"还是合理使用？

根据6月24日公示的法院文件，原告方指控OpenAI和微软存在以下行为：

系统性爬取：被告"秘密地"爬取出版商网站，包括付费墙后的受限内容
未经授权复制：将文章、报道和其他原创作品复制到自己的服务器用于模型训练
删除版权信息：故意剥夺作品中的版权管理信息，包括作者署名、版权声明和使用条款

诉讼同时涉及《版权法》侵权和违反《数字千年版权法》（DMCA）两项指控。原告要求获得法定损害赔偿及禁令救济。

代表原告的新泽西州前总检察长马修·普拉特金在接受采访时表示，这是"地方和区域报纸发起的最大规模法律行动"。他的律所Platkin LLP今年刚成立，显然瞄准的就是AI版权这块新战场。

OpenAI发言人Drew Pusateri的回应则是老调重弹："我们的模型赋能创新，训练所用数据来自公开可获得的数据，并以合理使用为基础。"

微软方面暂未回应。

"合理使用"还能撑多久？

OpenAI的"合理使用"（Fair Use）抗辩策略已经用了很多次，但在法律层面从未真正被检验过。

所谓合理使用，是美国版权法中的一个例外条款，允许在特定情况下（如评论、教学、新闻报道）未经许可使用受版权保护的作品。判断标准包括四个要素：使用目的和性质、作品性质、使用部分占原作比例、对原作市场的影响。

问题在于，AI训练场景和传统的"合理使用"情形差异巨大：

使用规模：传统合理使用通常涉及有限的引用，而AI训练动辄抓取数百万篇文章
商业目的：OpenAI估值已超千亿美元，这显然不是非营利的学术研究
市场替代：AI生成的内容可能直接与原创新闻竞争，抢走流量和广告收入

Sam Altman自己在英国上议院作证时承认，如果不使用受版权保护的材料，今天的顶尖AI模型将"无法训练"。这句话被写进了本次诉讼的起诉书——原告律师显然很懂如何利用对方的"自认"。

地方报纸：AI时代的弱势群体

这次诉讼的原告构成值得关注。不是《纽约时报》《华尔街日报》这样的全国性大报，而是近400家地方和区域报纸。

地方报纸的处境比大型媒体更加脆弱：

预算有限：很多地方报纸的年度预算可能还不如OpenAI一天的GPU租金
人员精简：通常只有几名到十几名记者，覆盖市政会议、学校、法院、公共安全等本地事务
营收依赖广告：数字化转型本就艰难，AI搜索进一步分流流量
不可替代性：AI无法派记者去参加社区会议、调查本地腐败、发布讣告

普拉特金说得很直接："人工智能系统无法对市政会议和社区会议进行深入评估，它们无法调查当地犯罪和腐败，无法发布讣告，也无法报道市中心新餐厅的开业。地方记者做到了这一点。"

这不是在反对AI创新，而是在问一个根本问题：AI的繁荣是否必须建立在内容生产者的消亡之上？

从《纽约时报》到400家地方报纸：媒体反击战升级

这场诉讼不是孤立事件，而是媒体行业对AI公司发起反击的最新一环。

时间线回顾

2023年12月：《纽约时报》率先起诉OpenAI和微软，指控两家公司未经许可使用数百万篇文章训练AI模型。这是第一家对OpenAI提起版权诉讼的主流媒体。

2024年2月：数字媒体The Intercept、Raw Story和AlterNet加入诉讼行列，指控OpenAI"搭便车"使用其新闻报道。

2024年同期：《大英百科全书》对OpenAI提起版权侵权诉讼。

2024年：8家报纸联合起诉OpenAI和微软。

2026年6月：近400家地方报纸组成的联盟发起诉讼，规模空前。

可以看到，诉讼主体正在从个别大媒体扩展到整个行业，从全国性媒体下沉到地方媒体。这说明版权问题已经触及整个新闻行业的生存根基。

已达成协议的另一条路

并非所有媒体都选择了对抗。美联社早在2023年7月就与OpenAI达成了许可协议，德国媒体巨头斯普林格集团也走了合作路线。

但协议条款从未公开，外界无从知道这些"合作"对内容方是否公平。而且，有能力与OpenAI坐下来谈判的，通常是那些有议价能力的大型媒体。对于资源有限的地方报纸来说，集体诉讼可能是唯一可行的选择。

技术与法律的碰撞：几个关键问题

1. "公开可获得"等于"可以随便用"吗？

OpenAI的标准回应是训练数据"来自公开可获得的数据"。但"公开可获得"和"可以免费商用"是两回事。你能在网上免费看到一篇文章，不代表你可以把它复制到自己的服务器上用来训练商业产品。

更何况，诉讼指控OpenAI甚至爬取了付费墙后的内容。

2. AI输出能否"洗白"版权问题？

AI公司的一个潜在抗辩是：模型输出的内容与训练数据不同，因此不构成侵权。但这个论点有明显漏洞——《纽约时报》的诉讼中就展示了ChatGPT几乎逐字复现其文章的案例。

而且，即便输出不完全相同，训练过程中的复制行为本身可能就已经构成侵权。

3. 如何证明"因果关系"？

诉讼的一个技术难点是：如何证明特定文章被用于训练？AI公司通常不公开训练数据集的完整内容。

《纽约时报》的做法是通过prompt工程让ChatGPT输出与原文高度相似的内容，以此作为间接证据。OpenAI则反驳说这是"黑客行为"。这个证据争议本身可能就会成为后续案件的焦点。

判决可能带来的行业影响

无论最终结果如何，这场诉讼都可能重塑AI行业的游戏规则。

如果原告胜诉：

授权成本飙升：AI公司将不得不与内容方签订付费协议，训练成本大幅上升
数据合规门槛提高：未来的模型训练需要更严格的数据溯源和授权管理
小型AI公司受冲击：只有资金雄厚的大公司才能承担高额授权费用
可能催生数据交易市场：出现专门撮合AI公司和内容方的中介平台

如果被告胜诉（合理使用成立）：

确立AI训练的法律先例：其他内容方的维权空间被大幅压缩
媒体行业雪上加霜：失去通过版权获得补偿的可能性
可能引发立法博弈：媒体行业转向游说国会修改版权法

更可能的中间结果：

和解并签订协议：参考美联社和斯普林格的先例
建立行业规范：形成类似音乐行业ASCAP/BMI的版税分配机制
推动AI公司主动合规：为避免诉讼风险，提前签订授权协议

开发者视角：这场官司和你有什么关系？

如果你是调用GPT、Claude等模型API的开发者，这场诉讼可能不会直接影响你的日常开发。但有几点值得关注：

模型能力边界可能变化

如果AI公司被迫收缩训练数据范围，未来模型在特定领域（如新闻、文学）的表现可能下降。已经有开发者反馈，某些模型在涉及最新新闻时会刻意"装傻"，这可能与版权规避策略有关。

企业用户的合规风险

如果你在开发面向企业的AI应用，客户可能会问：你用的模型训练数据合规吗？出了版权问题谁担责？这些问题目前没有标准答案，但随着诉讼案件增多，合规审查会越来越严格。

RAG架构的重要性上升

相比依赖模型的内置知识，使用RAG（检索增强生成）架构接入合规数据源可能变得更加重要。这样至少可以明确知识来源，降低版权风险。

这不只是钱的问题

表面上看，这场诉讼是关于"AI公司该不该为训练数据付费"。但更深层的问题是：在AI时代，原创内容的价值如何被认可和保护？

地方新闻的价值不在于它能产生多少广告收入，而在于它是社区民主运作的基础设施。没有地方记者，就没有对本地政府的监督，没有社区事件的记录，没有邻里之间的信息纽带。

如果AI可以无偿吸收这些内容来增强自己的能力，却不向内容生产者提供任何回报，最终的结果可能是：AI变得越来越"聪明"，而支撑这种聪明的原创内容却越来越少。

这是一个典型的公地悲剧。

写在最后

这场诉讼的最终结果可能要等上几年。但它提出的问题——AI创新与版权保护如何平衡——已经成为整个行业必须面对的核心议题。

对于AI公司来说，"先用了再说"的野蛮生长阶段可能正在结束。对于内容创作者来说，这可能是争取自身权益的最后窗口期。

无论你站在哪一边，都值得关注这场官司的进展。它的结果，可能会决定未来十年AI与内容产业的关系走向。

参考来源：

IT之家：近400家美国报纸联合起诉OpenAI和微软白嫖内容 - 本次诉讼的基本情况报道

400家报纸围攻OpenAI：地方新闻的生死之战

400家报纸围攻OpenAI：地方新闻的生死之战

诉讼核心：系统性"白嫖"还是合理使用？

"合理使用"还能撑多久？

地方报纸：AI时代的弱势群体

从《纽约时报》到400家地方报纸：媒体反击战升级

时间线回顾

已达成协议的另一条路

技术与法律的碰撞：几个关键问题

1. "公开可获得"等于"可以随便用"吗？

2. AI输出能否"洗白"版权问题？

3. 如何证明"因果关系"？

判决可能带来的行业影响

如果原告胜诉：

如果被告胜诉（合理使用成立）：

更可能的中间结果：

开发者视角：这场官司和你有什么关系？

模型能力边界可能变化

企业用户的合规风险

RAG架构的重要性上升

这不只是钱的问题

写在最后

相关推荐

Token终于有「国标」了？信通院组22家巨头筹建词元服务工作组

英伟达开源MoE加速神器：一行代码，微调快3.7倍

开源安全迎来「核保护伞」：Akrites 项目正式启动

联系我们