Anthropic 将允许欧盟网络安全局通过 Project Glasswing 计划测试 Mythos 模型，这是首个获得访问权的欧盟机构。该模型因具备强大的漏洞发现能力而引发安全争议。

Anthropic 向欧盟网络安全局开放 Mythos 模型测试访问

Anthropic 决定向欧盟网络安全局（ENISA）开放其争议性 AI 模型 Mythos 的测试访问权限，使其成为首个获得该模型访问资格的欧盟机构。这一决定是在欧盟官员数周密集游说后做出的，也标志着 Anthropic 在处理高风险 AI 能力方面采取了更加开放但谨慎的策略。

欧盟为何如此急切

自 Mythos 模型 4 月末发布以来，欧盟及成员国官员就一直在争取访问权限。上周，欧盟委员会官员专程飞往旧金山与 Anthropic 高管会面，这种高层级的直接接触在 AI 监管领域并不常见。

欧盟的焦虑有其现实基础。Mythos 被 Anthropic 描述为具有"异常强大的洞察网络安全漏洞能力"的模型，这意味着它既可以帮助防御者发现系统弱点，也可能被攻击者用作武器。对于正在推进《人工智能法案》实施的欧盟来说，无法评估这类高风险模型的实际能力是不可接受的。

欧盟委员会发言人 Thomas Regnier 的表态很能说明问题："Mythos 并非独有特例，未来还会有更强大的模型进入市场。我们正在与美国等理念相合的伙伴展开讨论，共同面对挑战。"这句话透露出两层信息：一是欧盟认为 Mythos 只是开始，更强大的网络安全 AI 工具即将出现；二是欧盟希望与美国建立某种协调机制，而不是各自为政。

欧盟委员会官员与 Anthropic 高管在旧金山会面

Project Glasswing：渐进式开放的实验

Anthropic 的解决方案是将 ENISA 纳入"Project Glasswing"（玻璃之翼计划）。这个计划的核心思路是让政府机构和关键基础设施运营商在 Mythos 大规模发布前先行测试，既评估模型能力，也检验自身系统的安全性。

这种渐进式开放策略在 AI 行业并不新鲜，OpenAI 在 GPT-4 发布前也采用过类似做法。但 Mythos 的特殊性在于，它的核心能力本身就是发现漏洞——这是一把双刃剑。如果测试过程中发现某个关键基础设施存在严重漏洞，而这个漏洞在修复前被泄露或被其他人发现，后果可能是灾难性的。

Anthropic 上周末将这一决策告知欧盟委员会，但具体的访问时间表、测试范围、数据共享协议等细节尚未公开。知情人士透露，相关讨论仍处于保密阶段，这也是为什么 Regnier 拒绝透露 ENISA 何时能真正接入 Mythos，而 Anthropic 则完全不予置评。

网络安全 AI 的两难困境

Mythos 引发的争议本质上是网络安全领域的经典两难：公开漏洞信息能帮助防御者修复问题，但也可能被攻击者利用；保密则让防御者无法及时应对威胁。AI 模型的出现让这个两难更加复杂。

传统的漏洞披露流程有明确的时间窗口和责任方。研究人员发现漏洞后会先通知厂商，给予一定时间修复，然后再公开细节。但 Mythos 这类模型的能力是持续的、自动化的，它可以在短时间内扫描大量系统，发现人类研究人员需要数月才能找到的漏洞。

更棘手的是，模型的"知识"很难像传统软件那样精确控制。即使 Anthropic 限制了 Mythos 的访问权限,一旦模型被部署到某个机构,如何确保其发现的漏洞信息不会泄露?如何防止测试人员将模型的输出用于非授权目的?这些问题目前都没有成熟的解决方案。

部分欧盟官员的担忧正是基于此。他们担心 Mythos 可能成为"利用漏洞的工具",这不是杞人忧天。2023 年就有研究显示,某些大语言模型在经过特定训练后,可以生成可执行的漏洞利用代码。Mythos 如果真的具备 Anthropic 所说的"异常强大"能力,那它在错误的人手中能造成多大破坏,确实值得警惕。

网络安全漏洞发现流程对比图：传统方式 vs AI 辅助方式

OpenAI 的对比策略

值得注意的是,OpenAI 在处理类似问题时采取了不同路径。根据近期报道,OpenAI 表示将允许欧盟访问其新的网络安全模型,但具体是哪个模型、访问条件如何,目前信息有限。

OpenAI 和 Anthropic 在 AI 安全理念上一直有微妙差异。OpenAI 更倾向于通过技术手段(如 RLHF、Constitutional AI 的前身技术)来约束模型行为,然后相对开放地发布;Anthropic 则更强调"可解释性"和"可控性",倾向于在充分理解模型能力和风险后再逐步开放。

Mythos 的案例似乎印证了这种差异。Anthropic 选择了一个相对保守的策略:先让少数可信机构测试,收集反馈,评估风险,然后再决定下一步。这种做法的好处是风险可控,坏处是可能延缓技术普及,也可能让其他不那么谨慎的竞争对手抢占市场。

ENISA 的角色与责任

欧盟网络安全局(ENISA)成立于 2004 年,最初只是一个咨询机构,但在 2019 年《网络安全法案》通过后,其权力和职责大幅扩展。ENISA 现在负责协调欧盟成员国的网络安全政策,制定安全标准,组织大规模网络攻击演练,以及评估新兴技术的安全风险。

让 ENISA 成为首个测试 Mythos 的欧盟机构是一个合理选择。ENISA 有技术能力评估模型的实际表现,有政策视角判断其对欧盟网络安全态势的影响,也有协调能力将测试结果转化为成员国层面的行动。

但 ENISA 也面临挑战。首先是资源问题。ENISA 的预算和人员规模相比美国 CISA(网络安全和基础设施安全局)要小得多,能否有效测试和评估 Mythos 这样复杂的系统,存在疑问。其次是协调问题。欧盟 27 个成员国的网络安全能力参差不齐,ENISA 的测试结果如何转化为各国都能执行的政策,需要大量协调工作。

更深层的问题是,ENISA 测试 Mythos 的目标到底是什么?是评估模型本身的安全性,还是用模型测试欧盟关键基础设施的安全性?如果是后者,那测试范围有多大?能源、交通、金融、医疗,哪些领域会被纳入?这些问题的答案将决定 Project Glasswing 在欧盟的实际效果。

监管与创新的平衡

欧盟在 AI 监管上一直走在前面。《人工智能法案》将 AI 系统按风险分级,对高风险应用施加严格要求。网络安全 AI 工具毫无疑问属于高风险类别,需要经过合规性评估、透明度审查、人类监督等多重检验。

Mythos 的案例是这套监管框架的一次实战检验。如果 ENISA 的测试顺利,证明 Anthropic 的渐进式开放策略有效,那可能为其他高风险 AI 工具树立范例。如果测试中出现问题——比如发现 Mythos 的能力被高估,或者发现其输出难以控制——那可能促使欧盟收紧监管,要求更严格的预发布审查。

但监管不能扼杀创新。网络安全是一个攻防不断升级的领域,防御方需要最先进的工具。如果欧盟的监管流程过于繁琐,导致 Mythos 这类工具迟迟无法在欧盟使用,那受损的将是欧盟自身的网络安全能力。攻击者不会等待监管审批完成才发起攻击。

Thomas Regnier 提到的"与美国等理念相合的伙伴展开讨论"可能是一个解决方向。如果欧盟和美国能在高风险 AI 工具的评估标准、测试流程、信息共享机制上达成共识,那既能保证安全,也能避免重复劳动和监管套利。但考虑到欧美在数据隐私、反垄断等问题上的分歧,这种协调不会容易。

欧盟《人工智能法案》风险分级示意图

行业影响与未来走向

Anthropic 向 ENISA 开放 Mythos 测试,对整个 AI 行业有示范意义。它表明,即使是最前沿、最敏感的 AI 能力,也可以通过精心设计的流程实现负责任的开放。这可能鼓励其他 AI 公司采用类似策略,而不是简单地选择"全面开放"或"完全保密"。

但这也可能加剧行业分化。有能力建立 Project Glasswing 这类复杂测试计划的,只有资源雄厚的头部公司。中小型 AI 公司如果开发出类似能力,可能既没有资源做渐进式开放,也没有话语权与监管机构谈判,最终可能被迫放弃相关研发,或者冒险直接发布。

从技术角度看,Mythos 代表的方向——AI 辅助网络安全——肯定会继续发展。攻击者已经在使用 AI 工具自动化漏洞发现和利用,防御方不可能放弃这个武器。问题不是要不要发展这类技术,而是如何确保它们被负责任地使用。

Anthropic 的做法提供了一个参考答案:透明度、渐进式开放、与监管机构合作。但这个答案是否适用于所有场景,还需要更多实践检验。ENISA 的测试结果,以及 Anthropic 后续如何扩大 Mythos 的访问范围,将是重要的观察窗口。

开发者视角:这对你意味着什么

如果你是网络安全从业者,Mythos 这类工具的出现既是机遇也是挑战。机遇在于,AI 辅助的漏洞发现可以大幅提升工作效率,让你能覆盖更多系统、发现更隐蔽的问题。挑战在于,你的对手也可能用上类似工具,攻防的节奏会加快。

对于普通开发者,Mythos 的启示是:不要指望"默默无闻"能保护你的系统。过去,小项目、内部系统可能因为不引人注目而相对安全。但 AI 工具可以大规模自动化扫描,你的代码库再小众,也可能被发现漏洞。安全编码实践、依赖项管理、及时更新,这些基础工作的重要性会进一步提升。

从工具链角度,可以预见会有更多 AI 辅助的安全工具出现。GitHub Copilot 已经在帮你写代码,未来可能会有类似工具帮你审计代码、发现漏洞、生成修复补丁。但这些工具的可靠性如何,会不会引入新的风险(比如 AI 生成的修复代码本身有问题),都需要时间验证。

结语

Anthropic 向 ENISA 开放 Mythos 测试,是 AI 安全治理的一个里程碑事件。它展示了一种可能的路径:既不完全开放导致风险失控,也不完全封闭导致技术停滞,而是通过与可信机构合作,在控制风险的前提下推进技术发展。

但这条路能走多远,还有很多不确定性。ENISA 的测试会发现什么?Anthropic 会根据测试结果做出哪些调整?其他 AI 公司会跟进还是选择不同策略?欧盟的监管框架会因此收紧还是放松?这些问题的答案,将在未来几个月逐渐清晰。

可以确定的是,网络安全 AI 工具不会消失,只会越来越强大。如何在利用其能力和控制其风险之间找到平衡,是整个行业必须回答的问题。Mythos 和 Project Glasswing 提供了一个早期答案,但绝不是最终答案。

参考来源

消息称 Anthropic 将向欧盟网络安全局开放 Mythos 模型 - IT之家 - 彭博社消息,详细报道了 Anthropic 向 ENISA 开放 Mythos 测试的决策过程和背景

Anthropic 向欧盟开放 Mythos 测试