Claude Mythos搅动全行业：6月高危漏洞报告暴涨3.5倍

Epoch AI 最新报告显示，2026 年 6 月全行业高危及关键漏洞报告数量约 1500 个，是此前月度最高纪录的 3.5 倍以上，源头指向 Anthropic 4 月发布的 Claude Mythos Preview 模型。这个尚未公开的第四层级模型正在重塑网络攻防的时间尺度。

Epoch AI 昨天发出的月度报告里藏着一个让整个安全行业不太舒服的数字：2026 年 6 月，全球 21 家机构一共报告了约 1500 个"高危"（high-severity）和"关键"（critical）级别的漏洞，是此前月度最高纪录的 3.5 倍以上。

这条曲线从 4 月开始拐头向上，时间点几乎精确地对齐 Anthropic 在 4 月 7 日抛出的那颗炸弹——Claude Mythos Preview。到目前，Anthropic 主导的 Project Glasswing（玻璃之翼项目）宣称已经通过 Mythos 挖到了超过 10,000 个高危或严重漏洞，其中相当一部分至今未公开。

换句话说，我们看到的这波暴涨只是浮出水面的部分。真正的浪还在水下。

Epoch AI 报告中 2026 年 4 月至 6 月月度高危漏洞报告数量激增趋势图

一款没公开发布的模型，把整个行业拖进新时代

先补一下 4 月那件事的上下文。Mythos Preview 是 Anthropic 迄今为止最强的前沿模型，性能显著超过 Claude Opus 4.6，被内部划到自称的"Copybara"第四层级——比 Haiku、Sonnet、Opus 三兄弟高一档。CyberGym 基准上 Mythos 拿到 83.1%，Opus 4.6 是 66.6%，差距不是一两个百分点的调优，是台阶式的跃迁。

但 Anthropic 做了一个反常规的动作：不发布。

原因很简单——这玩意儿太危险。它能自主发现零日，能自主写出利用程序，能把三五个独立漏洞串联成完整的权限提升链，从普通用户走到 root，全程不用人管。Anthropic 官方给出的三个案例很能说明问题：

OpenBSD 里一个隐藏 27 年的漏洞。这个操作系统是防火墙、边界设备的老牌选择，业内公认最严的一档。Mythos 找到一个远程崩溃漏洞——发个特定包就把机器打死。
FFmpeg 里一个 16 年前的一行代码漏洞。自动化模糊测试对着它跑了 500 万次都没触发，Mythos 找出来了。
Linux 内核里的多个漏洞被自动串联，形成一条完整的本地提权路径。

把这三件事放一起看，问题就不是"AI 能不能找漏洞"了——那已经是 DARPA AIxCC 时代的旧问题。真正的问题是：AI 能以什么样的成本和速度找漏洞。

绿盟科技的实测数据给了一个更直观的比例：千万行代码级别的全量挖掘，过去要资深安全专家几个月，现在用 Mythos 数小时内跑完，成本不到 2 万美元；单个漏洞的识别，几分钟内完成，成本低于 50 美元。

50 美元一个高危漏洞。这个价格已经把整个漏洞市场的经济学炸穿了。

那个 3.5 倍是怎么来的

回到 Epoch AI 那份报告。3.5 倍这个数字有意思的地方在于，它并不完全来自 Mythos 本身——Mythos 是受控访问，只有 Glasswing 的 12 家创始伙伴（AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通、Linux 基金会、Microsoft、Nvidia、Palo Alto Networks）加约 40 家关键基础设施组织能用。

3.5 倍是"辐射效应"。

第一层，Glasswing 项目伙伴用 Mythos 在自己的系统里扫，扫出来的东西按照负责任披露的流程走进 CVE 数据库。这是官方渠道，量级不小但可控。

第二层，同期其他模型厂商——Axios 报道 OpenAI 也在筹备一款"具备高级网络安全能力的产品"给少数合作伙伴。行业跟进的动作已经开始。

第三层，也是最迅猛的一层，是普通研究员用现有的公开模型（Opus 4.6、GPT-5、DeepSeek 等）在 GitHub 上扫开源项目。Mythos 展示的方法论——多轮上下文管理、Skill 累积、Agent 编排——被安全圈迅速吸收，即使拿次一档的模型，只要工程管线搭得好，也能出量。

结果就是漏洞披露端集体井喷。

生态被撑爆的信号

上游产量暴涨，下游根本吃不下，这才是真正麻烦的地方。

最直接的信号是 HackerOne 4 月宣布暂停 Internet Bug Bounty（IBB）计划，直接连锁到 Node.js 宣布不再提供抓漏奖金。理由摆出来相当无奈：漏洞修复能力没有跟上漏洞发现速度，AI 生成的漏洞报告严重淹没维护者，有效提交比例从 15% 掉到 5%。

翻译一下就是：一堆 AI 生成的、看起来像模像样但要么误报、要么价值极低的报告，把开源维护者的时间吞掉了。真正有价值的报告混在里面，反而更难被处理。

Anthropic 也意识到这个问题，向 Linux 基金会旗下的 Alpha-Omega、OpenSSF 捐了 250 万美元，向 Apache 基金会捐了 150 万，试图给下游打点补给。但对于全球开源软件生态来说，这几百万连塞牙缝都不够。

更深一层的结构性问题是漏洞武器化窗口的坍缩：

传统流程：从漏洞被发现到被利用，通常几周到几个月。
Mythos 时代：Mythos 可以自主整合 3-5 个漏洞形成多阶段攻击序列，从初访问到域管理员权限只要几个小时。而防御方的补丁周期还停留在按天、按周计。

CrowdStrike 前身 Sophos 的 Dan Schiappa 说得很直白：漏洞发现和武器化之间的时间差，正在被压缩到"一个 Prompt 的代价"。防御方需要审查和修复的漏洞总量会大规模扩张。

攻防不对称的两面

这里必须承认一个尴尬的事实：Mythos 这类模型的攻防属性天然是不对称的。

攻击方只要有一个漏洞能用就够了。防御方要堵所有的漏洞。Mythos 挖出来的 10,000 多个高危漏洞，Glasswing 内部消化的速度决定了这些漏洞的"透明期"有多长——一旦公开或者被 Mythos 级别的能力泄露到别处，全球的攻击者会同时得到一份丰盛的自助餐。

Anthropic 自己也在文件里承认：Mythos 级能力的扩散周期"以月而非年计算"。

这也是为什么美国财政部长贝森特、美联储主席鲍威尔在 4 月 7 日紧急召集花旗、摩根士丹利、美银、富国、高盛开会。英国央行、FCA、财政部同期也和 NCSC、各大银行保险交易所紧急磋商。这些动作不是危言耸听——如果 Mythos 级能力落到国家级对手手里，金融基础设施是首当其冲的目标。

IMF 总裁格奥尔基耶娃在 CBS 节目上直接说：全球货币体系还没准备好应对 AI 风险的快速升级。这不是外交辞令，是给自己找台阶。

Anthropic Project Glasswing 项目合作伙伴生态示意图

对开发者意味着什么

作为开发者，从 4 月到现在这 3 个月里，你可能已经感受到几件事：

你的 CI/CD 需要重新设计。 传统的 SAST/DAST 工具在 Mythos 级 AI 面前基本是幼儿园水平。绿盟给出的建议是安全极度左移，把 AI 安全智能体直接嵌入到 GitHub Actions 或 GitLab CI/CD 里，让每一个 PR 都过一遍 AI 审计。发现严重缺陷就自动标记为"需要修复"，在合并阶段就拦下来。

依赖链风险指数级放大。 你项目里那些多年没人动的依赖——尤其是那些用了古老 C/C++ 库的——里面很可能睡着 Mythos 级模型十分钟能挖出来的漏洞。SBOM（软件物料清单）从合规选项变成生存必需。

AI 生成代码需要用 AI 速度的审查跟上。 Futurum Group 的观点很直接：AI 生成代码现在需要以与生成速度相同的对抗性审查速度进行审计，只有嵌入开发工作流的 AI 原生应用安全工具能弥合这个差距。人肉 review 已经跟不上了。

权限模型和微分段值得再花时间。 假设漏洞必然被 AI 快速发现，那么防御重心就得从"堵漏洞"转移到"控制利用后的爆炸半径"。细粒度的网络隔离、严格的身份验证、完整的日志——即便 Mythos 找到某个边缘服务的零日，完善的分段也能延缓横向移动。

对于想尝鲜 Claude 系列做安全相关工作流的开发者，Mythos Preview 本身是受控访问，普通用户碰不到。但 Claude Opus 4.6、Sonnet 这些公开可用的模型在代码审计、CTF 类任务上的表现依然属于第一梯队——绿盟实测 Opus 4.6 在专家级 CTF 上 flag 获取成功率 79%（44/56）。想直接调用的话，OpenAI Hub 一个 Key 就能同时打通 Claude、GPT、Gemini、DeepSeek 几家，兼容 OpenAI 格式，国内直连，接入成本很低。

一个没被广泛讨论的问题：漏洞披露机制本身

最后想聊一个偏冷的角度。Mythos 事件里最容易被忽略的一件事是：现有的漏洞披露机制是基于人类速度设计的。

CVE 编号分配、CVSS 打分、CISA 的 KEV 目录、厂商的 90 天披露窗口——这一整套流程假设的是漏洞发现是稀缺资源，需要一套仪式化的流程来处理。

当 Mythos 一夜之间挖出上万个高危漏洞时，这套流程直接卡死。谁来打分？谁来验证 PoC？CVE 编号池够不够？维护者有没有时间响应？——都不够。

Anthropic 采取的临时方案是"加密哈希提交"：对于还没修复的漏洞，先公开加密哈希占位，等修复完成再公开细节。这是个务实的妥协，但也说明现有机制正在被 AI 的产能击穿。

更长远的问题是：如果发现漏洞变得像跑单元测试一样便宜，那么"漏洞"这个概念本身可能需要重新定义。 是不是所有能崩溃程序的输入都值得一个 CVE？是不是 CVSS 8.5 以下的都可以不算数了？行业还没答案。

尾声

参议员马克·沃纳的表态其实说得挺准：AI 极大地加速了漏洞发现，业界必须相应地加快并重新调整漏洞修补的优先级。

从 4 月到 6 月，短短两个月，Epoch 记录到 3.5 倍的报告激增。可以预期 7 月、8 月的数字只会更高——因为 Glasswing 项目才刚跑到 90 天报告节点，因为其他厂商的对标模型正在追赶，因为整个行业的方法论还在扩散。

Mythos 没有正式发布，但它已经把 AI 时代的网络安全新常态推到我们面前：漏洞的发现速度、修复速度、利用速度，全部被 AI 重新标定。谁先适应新的时间尺度，谁就能活下来。

参考来源

IT之家：Anthropic 最强抓虫 AI 助推，Epoch 称 6 月报告高危漏洞数是此前纪录 3.5 倍 —— 本次事件核心数据源，Epoch AI 月度报告解读

AI抓虫太狠：Claude Mythos让高危漏洞报告暴涨3.5倍

一款没公开发布的模型，把整个行业拖进新时代

那个 3.5 倍是怎么来的

生态被撑爆的信号

攻防不对称的两面

对开发者意味着什么

一个没被广泛讨论的问题：漏洞披露机制本身

尾声

参考来源

相关推荐

阿里 Qoder 企业版全球开卖：Credits 池化+按库分模型

Mistral 发 Leanstral 1.5：6.5B 激活参数啃下 Lean 4 证明

Mcpsnoop 开源：给 MCP 协议做个 Wireshark

联系我们