Claude 4.8蒸馏风波:Anthropic指控背后的双标与AI伦理裂痕

行业快讯

Anthropic公开指控DeepSeek、Moonshot、MiniMax通过2.4万账户、1600万次交互蒸馏Claude 4.8,引发全球AI圈强烈反弹。蒸馏究竟是技术常态还是工业级盗窃?这场争议撕开了AI对齐伦理与版权博弈的最后一块遮羞布。

一场把行业潜规则摆到台面上的指控

这两天 AI 圈最热闹的事,不是哪家又发了新模型,而是 Anthropic 把同行告上了"道德法庭"。

5 月底,Anthropic 发布了一份措辞罕见强硬的调查报告,公开点名 DeepSeek、Moonshot(月之暗面)、MiniMax 三家中国头部模型公司,指控它们对刚发布不久的 Claude 4.8 实施了"工业规模的蒸馏攻击"。具体数字相当抓眼球:约 24,000 个欺诈账户、超过 1,600 万次交互,绕过区域访问限制和服务条款,系统性地把 Claude 4.8 当成"评分老师",提取推理、编程、工具调用等差异化能力,再用这些产出去训练自家模型。

Anthropic 这次没把话留半句。报告里直接把事件定性为"非法提取",还顺手拔高到"国家安全"高度——理由是这种行为绕过了美国对华的算力与技术出口管制。社交媒体上,Anthropic 联合创始人之一更是连发数贴,把"蒸馏 = 抄近道"的叙事推到风口浪尖。

但剧本没按 Anthropic 写的走。报告发出不到 48 小时,回旋镖就飞回来了。

Anthropic 报告截图与社交媒体上技术圈的群嘲对照

蒸馏到底是什么,又为什么这次被叫"违规"

先把技术说清楚,免得被叙事带偏。

知识蒸馏(Knowledge Distillation)是 Hinton 在 2015 年就提出的经典训练范式。简单讲,就是用一个能力更强的"教师模型"产生输出,再让一个更小或能力较弱的"学生模型"在这些输出上训练,从而把教师的能力浓缩进学生。这是大模型时代成本控制的标准操作之一,OpenAI、Google、Anthropic 自己都在用——他们把旗舰模型蒸馏成更便宜的 mini、haiku、flash 版本卖给企业客户,这是公开的商业模式。

Anthropic 这次反对的不是蒸馏本身,而是蒸馏对象是别人家的模型。它的逻辑链条是这样的:

  1. Claude 4.8 的 API 服务条款明确禁止用户将输出用于训练竞争模型;
  2. 这三家公司通过批量注册的虚假账户访问 API,本身已经违反条款;
  3. 提取的不是普通问答,而是 Claude 4.8 在 reasoning、agentic tool use、对齐与越狱防护等差异化维度上的输出;
  4. 因此这不是"学习",是"窃取"。

站在合同法和服务条款的角度,Anthropic 不是没道理。批量虚假账户 + 区域绕行,这两件事在任何一家 SaaS 厂商眼里都属于实打实的违规。问题是,Anthropic 自己屁股也没那么干净

回旋镖:Anthropic 自己就是版权官司的常客

质疑声里最尖锐的一条来自马斯克:贼喊捉贼。

这话不是骂人。Anthropic 过去两年因为训练数据来源问题已经吃过好几次官司:

  • 2024 年被多家美国出版商起诉,理由是未经授权使用大量盗版电子书(包括 LibGen 数据集)训练 Claude;
  • 2025 年与作家协会达成上亿美元和解,承认部分数据来源存在合规瑕疵;
  • 至于 Common Crawl 抓取的全网页内容,Anthropic 至今的官方立场仍然是"合理使用"。

换句话说,Anthropic 训练 Claude 的时候,把全网公开数据、盗版书库、新闻媒体内容统统当成"知识共有物",理由是"合理使用";轮到别人从 Claude 的 API 输出里学东西,立刻升级为"工业级盗窃"和"国家安全威胁"。

这种双标,连一向亲硅谷的 a16z 合伙人 Marc Andreessen 都看不下去,公开吐槽:"如果蒸馏算犯罪,那人类历史上每一次师徒传承、每一场学术研讨会,是不是都该被起诉?"

更尴尬的是技术圈拿出的"反向证据"。过去几个月,社区一直流传 Claude 在某些 prompt 下会冒出"我是 DeepSeek"或者"我是 ChatGPT"的截图。这种现象在技术上叫 identity hallucination / data contamination——模型在预训练或后训练阶段,喂进去的语料里混入了其他模型的输出。它至少说明一件事:在当下的全球数据循环里,模型互相"喝彼此的水"早就是常态,Claude 自己也没能免俗。

三家中国公司沉默背后的现实困境

截至发稿,DeepSeek、Moonshot、MiniMax 三家公司均未正面回应。这种沉默其实可以理解。

一方面,蒸馏行为在技术上极难自证清白。模型的训练数据来源链条复杂,即便没有主动从 Claude API 拉数据,开源社区里流传的 SFT 数据集、合成数据集很可能本身就包含 Claude 的输出。这就像你买了一袋米,没法证明里头每一粒都不是邻居家飘过来的。

另一方面,反驳的政治成本太高。Anthropic 把事情上升到"国家安全"和"出口管制",再多技术解释也会被美国政策圈解读成"心虚"。三家公司目前更务实的选择,是继续推产品。MiniMax 的 M2 已经在 Agent 场景里站稳脚跟,DeepSeek 的下一代推理模型据传也在路上。

但开发者社区不愿意装哑巴。linux.do 上一条热帖把这件事总结得很到位:"GPT 锐评 Claude 4.8 蒸馏国产模型,回旋镖来得太快"——讽刺的是,当用户把 Anthropic 的指控丢给 GPT-5 评论时,GPT 列出的第一条质疑就是:Anthropic 自己的训练数据来源同样不透明。

这件事真正的意义:AI 行业的"潜规则崩盘"

撕开口水战的外壳,这次事件有几个值得深想的点。

第一,闭源 API 厂商对"输出版权"的主张正在变强。

过去大家默认,你调用 API 拿到的输出可以自由使用。但从去年开始,OpenAI、Anthropic 在服务条款里都加入了"不得用于训练竞争模型"的条款。Anthropic 这次相当于把这一条款第一次拉到公开执法的层面。这对所有用 GPT/Claude 做合成数据、做 SFT 数据的团队都是一个信号——以前灰色地带的做法,未来可能直接被定性为违约甚至侵权。

第二,蒸馏 vs 独立研发的边界,正在被重新定义。

严格意义上的蒸馏(教师-学生范式,logits 级别的知识转移)在 API 场景下其实做不了,因为 API 不返回 logits。所谓"API 蒸馏",本质是用强模型生成高质量数据,再做 SFT 或 RLHF。这种做法和"找标注员写答案"在技术上并无本质区别,区别只在于:标注员是人还是另一个模型。Anthropic 想要建立的,是一条新的"数据来源洁净度"标准,但这条标准在工程上几乎不可执行。

第三,AI 对齐伦理被工具化了。

Anthropic 一直把"对齐"和"AI 安全"作为自己的品牌叙事核心。这次把对手的蒸馏行为和"国家安全"绑定,某种程度上是把"对齐伦理"当成了商业护城河的工具。这种做法短期能博舆论同情,长期会反噬其作为"AI 安全研究领头羊"的中立形象。已经有不少 alignment 研究者公开表态,不希望自己的工作被用来为商业战服务。

第四,开源路线和闭源路线的分歧被进一步放大。

讽刺的是,被指控的三家中国公司里,DeepSeek 和 Moonshot 都是开源路线的代表,模型权重公开下载,社区可以独立验证。而 Anthropic 是典型的闭源路线,至今没有开放过任何 Claude 模型的权重。当一家闭源公司指控开源公司"窃取"时,开发者天然倾向于站在开源一边——不是因为开源就一定对,而是因为开源至少把账摆在台面上。

对一线开发者意味着什么

抛开立场,做工程的人需要关心几件具体的事:

  • 如果你在用 Claude/GPT 的 API 生成 SFT 数据:仔细看一遍最新的服务条款,特别是"output usage restrictions"那几条。Anthropic 这次明显在收紧执法尺度,2.4 万账号被一次性封禁就是先例。
  • 如果你在做模型对比评测:Claude 4.8 的 API 访问可能会出现更严格的频控和地区限制,跨境调用要做好被封号的预案。
  • 如果你在搭多模型对接的应用:单一供应商风险显著上升,多模型聚合方案的价值进一步凸显。像 OpenAI Hub 这类一个 Key 同时对接 GPT、Claude、Gemini、DeepSeek 的聚合服务,在地缘 + 合规双重不确定下,确实能省掉很多账号管理和合规审计的麻烦。

多模型 API 聚合架构示意图

结尾:没有赢家的一场战争

这场争议大概率不会以法庭判决收场。Anthropic 拿不出可以在法庭上 100% 证明对方蒸馏的硬证据——账号关联、流量模式只是间接证据,模型权重又是黑箱。三家中国公司也不会主动承认,毕竟承认了就是把把柄送上门。

但事件本身已经造成了不可逆的影响。它把 AI 行业过去三年默默运转的"互相蒸馏、互为语料"的潜规则,第一次彻底摊开在阳光下。从此以后,每一家做基础模型的公司,都得回答两个问题:你的数据来源能讲清楚吗?你自己又用没用过别人 API 的输出?

如果答案都是诚实的,那大概率谁也别指责谁。如果答案不诚实,那 Anthropic 这次开的头,最终也会回到自己身上。

AI 行业到了一个新的拐点——不是技术上的,而是规则上的。

参考来源