FuzzingBrain V2登场:多智能体LLM把漏洞挖掘和PoC复现一锅端

模型上新

一篇新论文给出了Multi-Agent LLM在大型C/C++项目里自动发现深层漏洞并生成可复现PoC的完整方案,把传统fuzzing与LLM Agent的角色分工推到了新阶段。

漏洞挖掘的下一个分水岭:让Agent自己把PoC也写了

5 月底,arXiv 上挂出的一篇论文在安全圈悄悄刷屏——FuzzingBrain V2,一个面向自动化漏洞发现与复现的多智能体 LLM 系统。这并不是又一个"LLM 帮你写 fuzz harness"的小修小补,而是把"挖洞"和"复现"这两件历来割裂的事,用 Agent 协作的方式接到了一条流水线上。

用一句话总结作者要回答的问题:能不能让 LLM 多智能体在大型 C/C++ 项目里既挖出深层漏洞、又同时吐出一个能跑起来的 PoC 输入,而不是甩出一堆"看起来像漏洞"的报告让人工再花一周去验证?

这件事过去几年没人解决好,是因为它确实难。看完论文再对照过去半年业界的相关工作,这次的方案值得展开讲讲。

FuzzingBrain V2 多智能体协作架构示意

为什么这事在 2026 年才被认真做出来

回头梳理一下自动化漏洞挖掘的范式跃迁,你会发现 FuzzingBrain V2 站在的位置并不偶然。

  • 2022 年之前:传统 fuzzing 主导。AFL、libFuzzer、syzkaller 解决的是"输入空间爆炸"的问题,但对深层逻辑漏洞基本无能为力,且高度依赖人工写 harness。
  • 2023 年:Google OSS-Fuzz 的 AI-Powered Fuzzing 第一次把 LLM 嵌进 fuzzing 流程,让模型生成 fuzz target。这一年 LLM 的角色是"增强工具",不是"替代工具"。
  • 2024 年:Claude 3.5、LangGraph 之后 Agent 工程化成熟。OSS-Fuzz 的 Leveling Up Fuzzing 在 272 个 C/C++ 项目里靠 LLM agent 生成 harness、自动修编译错误,最终从 OpenSSL 里挖出了埋了二十年的 CVE‑2024‑9143。这是 Agent 真正开始打出战绩的拐点
  • 2025 年:Anthropic 推出 Automated Security Reviews with Claude Code,SCONE-bench 用来评估智能合约场景的 agent 能力;腾讯 atum 团队公布在主流开源仓库年挖 60+ 真实漏洞、过半高危的成绩。

这条曲线非常清楚:LLM 不再是辅助工具,而开始接管"决策"层。但即便如此,绝大多数系统仍止步于"报告漏洞",没有去交付一份能跑的 PoC。而在工业界,没有 PoC 的漏洞报告几乎等于没报告——SRE 不会信、产品不会修、CVE 评审也很难给高分。

FuzzingBrain V2 的价值,就在于明确把"可复现"作为第一目标。

系统怎么搭的:分工大于通才

论文里最值得抄作业的设计哲学,是拒绝让一个超级 Agent 干所有事。这跟过去半年很多人用单 Agent + 长 prompt 硬怼漏洞挖掘的思路完全不一样。

大致的 Agent 分工可以梳理成几类:

  1. Recon Agent(侦察):负责吃下代码仓库,定位高风险区域。它做的事情更接近一个静态分析工程师——看 Makefile、看入口函数、识别哪些 parser、哪些 IPC 边界值得重点关照。
  2. Hypothesis Agent(假设):基于 Recon 的输出提出具体漏洞假设。比如"这个 parse_header() 在长度字段 == 0 时可能整数下溢"。这一步是 LLM 做得最擅长的——结合上下文模式匹配 + 经验直觉。
  3. Harness Agent(构造):把假设翻译成可执行的 fuzz harness 或定向输入构造逻辑。这里复用了 OSS-Fuzz 那一脉积累的工程经验,包括自动修编译错误、自动找头文件依赖。
  4. Executor / Sanitizer Agent(执行与裁决):跑 fuzzing、跑 sanitizer(ASan/UBSan/MSan),从崩溃中区分真假阳性。
  5. Reproducer Agent(复现):拿到崩溃后,最小化输入、生成稳定可复现的 PoC,并附上调用栈、触发条件说明。

这套架构最关键的 insight 不是"多 Agent",而是用工具调用、消息传递把"模型的判断"和"工具的事实"清晰分开。LLM 负责猜,sanitizer 负责判,fuzzer 负责跑——每一步都有 ground truth 可以回灌。这才是 agentic 安全研究和"prompt 工程"的本质区别。

黑白盒的边界正在被抹掉

奇安信的安全团队在最近一篇技术分享里提到一个类似观察:MCP、RAG 这些工程化能力成熟后,黑盒和白盒分析的边界其实在被 Agent 模糊掉。FuzzingBrain V2 是个非常典型的例子——

  • 它能像白盒工具一样读源码、做数据流推理;
  • 又能像黑盒 fuzzer 一样疯狂打输入、看运行时反馈;
  • 还能像安全研究员一样,看完崩溃日志反过来修正自己的假设。

过去做漏洞挖掘平台,工程师要决定"我这个项目要不要符号执行""要不要插桩""要不要先做污点分析"。现在 Agent 自己根据上下文决定要用哪个工具——这是 LLM Agent 在安全方向落地最值钱的部分。

几个值得划重点的细节

读论文的时候,有几个工程细节其实比"我们挖到了 N 个 CVE"更值得注意:

  • 崩溃去重与归因。任何跑过 fuzzing 的人都知道,1 万个崩溃可能只对应 3 个真漏洞。FuzzingBrain V2 让 LLM 在去重时直接读 backtrace 语义,而不是简单 hash 调用栈顶几帧——这对宏多、inline 多的 C/C++ 项目特别有用。
  • PoC 最小化是单独建模的。传统 delta debugging 在结构化输入(比如 protobuf、媒体格式)上效果一般,作者让一个专门的 Reproducer Agent 理解格式语义后做最小化,PoC 体积显著下降。
  • 失败案例也被分析了。论文里没有回避 LLM 经常"幻觉漏洞"的现实,单独给出了哪些类别的漏洞 Agent 仍然搞不定,比如跨模块的并发竞争、长生命周期堆腐败——这部分坦诚得有点出乎意料。

跟同期工作怎么比

顺手对比一下今年看到的几个方向:

系统 / 工作 主要目标 LLM 角色 是否产出可复现 PoC
OSS-Fuzz Leveling Up (2024) 自动生成 harness 单 Agent + 工具 部分
IVAgent (看雪) 二进制/源码混合漏洞挖掘 多分析引擎调度 部分
Claude Code Security Review 代码审计 审计员 否(偏报告)
FuzzingBrain V2 挖洞 + 复现一体 多 Agent 分工 是,且最小化

横向看下来,FuzzingBrain V2 不一定在某个单点指标上最强,但它是少数几个把"产出可验证的 PoC"作为硬指标的系统。这件事的工程价值,可能比刷 benchmark 还重要。

这套思路对开发者意味着什么

如果你在做的是普通业务开发,别误以为这跟你无关。两个方向值得关注:

  1. CI 里嵌入 Agent 化的安全审查会越来越普遍。不是"跑个 SAST 工具",而是有一个 Agent 在 PR 上下文里思考"这次改的 parser 改了边界处理逻辑,要不要顺手 fuzz 一下"。这种能力 2026 下半年大概率会进主流 DevSec 工具链。
  2. 漏洞情报会被反向打通。今天的 CVE 报告大多还是人类语言。当 PoC 能由 Agent 自动产出,下一步就是 CVE → 自动复现 → 自动定位 → 自动修复 patch 的全链路,把漏洞响应时间从天级压到小时级。

一点冷静的判断

要说不足,也得讲一句。Agent 系统的成本不便宜——FuzzingBrain V2 这种多 Agent + 长上下文 + 反复工具调用的流程,跑一个中型项目消耗的 token 量相当可观。这也是为什么这类工作目前更多在论文和大厂内部跑,普通团队短期内复现一套类似系统的门槛不低。

但方向已经非常清楚:漏洞挖掘正在从"工具 + 专家"过渡到"Agent + 工具 + 专家",专家在链条里的位置正在上移——从写 harness、调 fuzzer,变成定义目标、审查结论。这不是替代关系,是分工重排。

做模型选型时顺带说一句,多 Agent 安全研究这类场景对模型的代码理解、长上下文稳定性、工具调用准确率都很挑剔,Claude、GPT、Gemini、DeepSeek 在不同环节的优势并不一样,团队里同时备几个模型轮换跑实验是常态。OpenAI Hub 这类用一个 Key 就能同时调主流模型的聚合接口,对这种需要横向对比的研究和工程工作来说,能少踩很多账号和网络上的坑。

至于 LLM 多智能体能不能最终接管漏洞挖掘?看 2026 年下半年各家在真实开源仓库上交出的 CVE 战绩就知道了。

参考来源