AI 快讯AI抓虫太狠:Claude Mythos让高危漏洞报告暴涨3.5倍
模型上新

AI抓虫太狠:Claude Mythos让高危漏洞报告暴涨3.5倍

2026-07-04T07:05:34.091Z
AI抓虫太狠:Claude Mythos让高危漏洞报告暴涨3.5倍

Epoch AI 最新报告显示,2026 年 6 月全行业高危及关键漏洞报告数量约 1500 个,是此前月度最高纪录的 3.5 倍以上,源头指向 Anthropic 4 月发布的 Claude Mythos Preview 模型。这个尚未公开的第四层级模型正在重塑网络攻防的时间尺度。

Epoch AI 昨天发出的月度报告里藏着一个让整个安全行业不太舒服的数字:2026 年 6 月,全球 21 家机构一共报告了约 1500 个"高危"(high-severity)和"关键"(critical)级别的漏洞,是此前月度最高纪录的 3.5 倍以上。

这条曲线从 4 月开始拐头向上,时间点几乎精确地对齐 Anthropic 在 4 月 7 日抛出的那颗炸弹——Claude Mythos Preview。到目前,Anthropic 主导的 Project Glasswing(玻璃之翼项目)宣称已经通过 Mythos 挖到了超过 10,000 个高危或严重漏洞,其中相当一部分至今未公开。

换句话说,我们看到的这波暴涨只是浮出水面的部分。真正的浪还在水下。

Epoch AI 报告中 2026 年 4 月至 6 月月度高危漏洞报告数量激增趋势图

一款没公开发布的模型,把整个行业拖进新时代

先补一下 4 月那件事的上下文。Mythos Preview 是 Anthropic 迄今为止最强的前沿模型,性能显著超过 Claude Opus 4.6,被内部划到自称的"Copybara"第四层级——比 Haiku、Sonnet、Opus 三兄弟高一档。CyberGym 基准上 Mythos 拿到 83.1%,Opus 4.6 是 66.6%,差距不是一两个百分点的调优,是台阶式的跃迁。

但 Anthropic 做了一个反常规的动作:不发布。

原因很简单——这玩意儿太危险。它能自主发现零日,能自主写出利用程序,能把三五个独立漏洞串联成完整的权限提升链,从普通用户走到 root,全程不用人管。Anthropic 官方给出的三个案例很能说明问题:

  • OpenBSD 里一个隐藏 27 年的漏洞。这个操作系统是防火墙、边界设备的老牌选择,业内公认最严的一档。Mythos 找到一个远程崩溃漏洞——发个特定包就把机器打死。
  • FFmpeg 里一个 16 年前的一行代码漏洞。自动化模糊测试对着它跑了 500 万次都没触发,Mythos 找出来了。
  • Linux 内核里的多个漏洞被自动串联,形成一条完整的本地提权路径。

把这三件事放一起看,问题就不是"AI 能不能找漏洞"了——那已经是 DARPA AIxCC 时代的旧问题。真正的问题是:AI 能以什么样的成本和速度找漏洞

绿盟科技的实测数据给了一个更直观的比例:千万行代码级别的全量挖掘,过去要资深安全专家几个月,现在用 Mythos 数小时内跑完,成本不到 2 万美元;单个漏洞的识别,几分钟内完成,成本低于 50 美元。

50 美元一个高危漏洞。这个价格已经把整个漏洞市场的经济学炸穿了。

那个 3.5 倍是怎么来的

回到 Epoch AI 那份报告。3.5 倍这个数字有意思的地方在于,它并不完全来自 Mythos 本身——Mythos 是受控访问,只有 Glasswing 的 12 家创始伙伴(AWS、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、摩根大通、Linux 基金会、Microsoft、Nvidia、Palo Alto Networks)加约 40 家关键基础设施组织能用。

3.5 倍是"辐射效应"。

第一层,Glasswing 项目伙伴用 Mythos 在自己的系统里扫,扫出来的东西按照负责任披露的流程走进 CVE 数据库。这是官方渠道,量级不小但可控。

第二层,同期其他模型厂商——Axios 报道 OpenAI 也在筹备一款"具备高级网络安全能力的产品"给少数合作伙伴。行业跟进的动作已经开始。

第三层,也是最迅猛的一层,是普通研究员用现有的公开模型(Opus 4.6、GPT-5、DeepSeek 等)在 GitHub 上扫开源项目。Mythos 展示的方法论——多轮上下文管理、Skill 累积、Agent 编排——被安全圈迅速吸收,即使拿次一档的模型,只要工程管线搭得好,也能出量。

结果就是漏洞披露端集体井喷。

生态被撑爆的信号

上游产量暴涨,下游根本吃不下,这才是真正麻烦的地方。

最直接的信号是 HackerOne 4 月宣布暂停 Internet Bug Bounty(IBB)计划,直接连锁到 Node.js 宣布不再提供抓漏奖金。理由摆出来相当无奈:漏洞修复能力没有跟上漏洞发现速度,AI 生成的漏洞报告严重淹没维护者,有效提交比例从 15% 掉到 5%。

翻译一下就是:一堆 AI 生成的、看起来像模像样但要么误报、要么价值极低的报告,把开源维护者的时间吞掉了。真正有价值的报告混在里面,反而更难被处理。

Anthropic 也意识到这个问题,向 Linux 基金会旗下的 Alpha-Omega、OpenSSF 捐了 250 万美元,向 Apache 基金会捐了 150 万,试图给下游打点补给。但对于全球开源软件生态来说,这几百万连塞牙缝都不够。

更深一层的结构性问题是漏洞武器化窗口的坍缩

  • 传统流程:从漏洞被发现到被利用,通常几周到几个月。
  • Mythos 时代:Mythos 可以自主整合 3-5 个漏洞形成多阶段攻击序列,从初访问到域管理员权限只要几个小时。而防御方的补丁周期还停留在按天、按周计。

CrowdStrike 前身 Sophos 的 Dan Schiappa 说得很直白:漏洞发现和武器化之间的时间差,正在被压缩到"一个 Prompt 的代价"。防御方需要审查和修复的漏洞总量会大规模扩张。

攻防不对称的两面

这里必须承认一个尴尬的事实:Mythos 这类模型的攻防属性天然是不对称的。

攻击方只要有一个漏洞能用就够了。防御方要堵所有的漏洞。Mythos 挖出来的 10,000 多个高危漏洞,Glasswing 内部消化的速度决定了这些漏洞的"透明期"有多长——一旦公开或者被 Mythos 级别的能力泄露到别处,全球的攻击者会同时得到一份丰盛的自助餐。

Anthropic 自己也在文件里承认:Mythos 级能力的扩散周期"以月而非年计算"。

这也是为什么美国财政部长贝森特、美联储主席鲍威尔在 4 月 7 日紧急召集花旗、摩根士丹利、美银、富国、高盛开会。英国央行、FCA、财政部同期也和 NCSC、各大银行保险交易所紧急磋商。这些动作不是危言耸听——如果 Mythos 级能力落到国家级对手手里,金融基础设施是首当其冲的目标。

IMF 总裁格奥尔基耶娃在 CBS 节目上直接说:全球货币体系还没准备好应对 AI 风险的快速升级。这不是外交辞令,是给自己找台阶。

Anthropic Project Glasswing 项目合作伙伴生态示意图

对开发者意味着什么

作为开发者,从 4 月到现在这 3 个月里,你可能已经感受到几件事:

你的 CI/CD 需要重新设计。 传统的 SAST/DAST 工具在 Mythos 级 AI 面前基本是幼儿园水平。绿盟给出的建议是安全极度左移,把 AI 安全智能体直接嵌入到 GitHub Actions 或 GitLab CI/CD 里,让每一个 PR 都过一遍 AI 审计。发现严重缺陷就自动标记为"需要修复",在合并阶段就拦下来。

依赖链风险指数级放大。 你项目里那些多年没人动的依赖——尤其是那些用了古老 C/C++ 库的——里面很可能睡着 Mythos 级模型十分钟能挖出来的漏洞。SBOM(软件物料清单)从合规选项变成生存必需。

AI 生成代码需要用 AI 速度的审查跟上。 Futurum Group 的观点很直接:AI 生成代码现在需要以与生成速度相同的对抗性审查速度进行审计,只有嵌入开发工作流的 AI 原生应用安全工具能弥合这个差距。人肉 review 已经跟不上了。

权限模型和微分段值得再花时间。 假设漏洞必然被 AI 快速发现,那么防御重心就得从"堵漏洞"转移到"控制利用后的爆炸半径"。细粒度的网络隔离、严格的身份验证、完整的日志——即便 Mythos 找到某个边缘服务的零日,完善的分段也能延缓横向移动。

对于想尝鲜 Claude 系列做安全相关工作流的开发者,Mythos Preview 本身是受控访问,普通用户碰不到。但 Claude Opus 4.6、Sonnet 这些公开可用的模型在代码审计、CTF 类任务上的表现依然属于第一梯队——绿盟实测 Opus 4.6 在专家级 CTF 上 flag 获取成功率 79%(44/56)。想直接调用的话,OpenAI Hub 一个 Key 就能同时打通 Claude、GPT、Gemini、DeepSeek 几家,兼容 OpenAI 格式,国内直连,接入成本很低。

一个没被广泛讨论的问题:漏洞披露机制本身

最后想聊一个偏冷的角度。Mythos 事件里最容易被忽略的一件事是:现有的漏洞披露机制是基于人类速度设计的

CVE 编号分配、CVSS 打分、CISA 的 KEV 目录、厂商的 90 天披露窗口——这一整套流程假设的是漏洞发现是稀缺资源,需要一套仪式化的流程来处理。

当 Mythos 一夜之间挖出上万个高危漏洞时,这套流程直接卡死。谁来打分?谁来验证 PoC?CVE 编号池够不够?维护者有没有时间响应?——都不够。

Anthropic 采取的临时方案是"加密哈希提交":对于还没修复的漏洞,先公开加密哈希占位,等修复完成再公开细节。这是个务实的妥协,但也说明现有机制正在被 AI 的产能击穿。

更长远的问题是:如果发现漏洞变得像跑单元测试一样便宜,那么"漏洞"这个概念本身可能需要重新定义。 是不是所有能崩溃程序的输入都值得一个 CVE?是不是 CVSS 8.5 以下的都可以不算数了?行业还没答案。

尾声

参议员马克·沃纳的表态其实说得挺准:AI 极大地加速了漏洞发现,业界必须相应地加快并重新调整漏洞修补的优先级。

从 4 月到 6 月,短短两个月,Epoch 记录到 3.5 倍的报告激增。可以预期 7 月、8 月的数字只会更高——因为 Glasswing 项目才刚跑到 90 天报告节点,因为其他厂商的对标模型正在追赶,因为整个行业的方法论还在扩散。

Mythos 没有正式发布,但它已经把 AI 时代的网络安全新常态推到我们面前:漏洞的发现速度、修复速度、利用速度,全部被 AI 重新标定。谁先适应新的时间尺度,谁就能活下来。

参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: