英伟达发布BioNeMo Agent:AI智能体正式进入药物研发实验室

英伟达推出BioNeMo Agent Toolkit,将十余年生命科学积累封装成可被AI智能体调用的工具集,让大模型能够直接操作蛋白质预测、分子对接等专业计算,标志着AI Agent在垂直领域的落地进入新阶段。
英伟达发布BioNeMo Agent:AI智能体正式进入药物研发实验室
6月23日,英伟达正式发布NVIDIA BioNeMo Agent Toolkit。这不是又一个生命科学AI模型,而是一套让AI智能体能够"动手做实验"的工具包。
简单说:以前的AI在药物研发中只能回答问题,现在它可以自己跑计算、分析结果、给出下一步建议。

这次发布的核心是什么
不是新模型,是"工具箱"
BioNeMo本身不是新东西。英伟达从2022年开始就在做这个生命科学AI平台,陆续集成了蛋白质结构预测、分子生成、基因组分析等能力。
但之前的BioNeMo更像一个"模型仓库"——你有问题,调用对应的模型,拿到结果。整个流程是人在驱动。
这次的Agent Toolkit改变了这个逻辑。
英伟达把十多年积累的生命科学库、工具、开放模型重新封装,变成了一组可以被AI智能体调用的API。换句话说,现在一个大语言模型可以像使用计算器一样使用这些专业工具:
- 需要预测蛋白质结构?调用AlphaFold2或ESMFold
- 要做分子对接?调用DiffDock
- 生成新的候选分子?调用MolMIM
- 分析基因组数据?调用对应的分析工具
关键变化在于:决定调用什么、什么时候调用、怎么解读结果,这些判断现在可以由AI智能体来做。
从"人用工具"到"AI用工具"
传统的药物研发流程大概是这样:
- 科学家提出假设
- 设计实验
- 运行计算(可能用到各种AI模型)
- 分析结果
- 根据结果调整假设,回到步骤1
每一步都需要人来判断和决策。一个有经验的计算化学家可能同时跑几十个实验,但他的时间和精力是瓶颈。
BioNeMo Agent Toolkit想做的是:让AI智能体承担步骤2-4的大部分工作。
科学家说"我想找一个能结合这个靶点的小分子",AI智能体可以:
- 分析靶点结构
- 生成一批候选分子
- 对每个候选分子做对接模拟
- 评估结合亲和力
- 筛选出最有希望的几个
- 给出理由和建议
整个过程自动进行,科学家只需要审核最终结果。
技术架构:怎么让AI智能体"懂"生命科学
工具调用层
这套Toolkit的底层是英伟达多年积累的NIM(NVIDIA Inference Microservices)微服务。每个专业能力都被封装成独立的服务:
蛋白质结构预测
- AlphaFold2:DeepMind的明星模型,预测蛋白质三维结构
- ESMFold:Meta的蛋白质语言模型,速度更快
- OpenFold:开源实现,方便定制
分子生成与优化
- MolMIM:英伟达自研的分子生成模型
- REINVENT:基于强化学习的分子优化
- 支持SMILES、分子图等多种表示
分子对接
- DiffDock:基于扩散模型的对接预测
- AutoDock-GPU:经典对接工具的GPU加速版
基因组分析
- 单细胞RNA测序分析
- 变异检测
- 生物标志物发现
每个服务都有标准化的API接口,输入输出格式统一。这是让AI智能体能够调用它们的基础。
智能体编排层
光有工具不够,还需要让AI智能体知道怎么用这些工具。
BioNeMo Agent Toolkit提供了一套编排框架,核心包括:
任务规划器(Task Planner)
接收高层次的研究目标,分解成具体的计算任务。比如"评估这个化合物的成药性"会被分解为:
- 预测溶解度
- 预测代谢稳定性
- 预测毒性
- 预测合成可行性
工具选择器(Tool Selector)
根据任务类型选择合适的工具。有些任务有多个工具可选,选择器会根据精度要求、计算资源、时间限制等因素做出选择。
结果解释器(Result Interpreter)
把专业工具的输出转化为可理解的分析。一个对接分数-8.5 kcal/mol意味着什么?这个亲和力在已知药物中处于什么水平?结果解释器负责提供这些上下文。
决策引擎(Decision Engine)
根据当前结果决定下一步行动。如果对接分数不够好,是调整分子结构重新生成,还是换一个靶点口袋?这个判断逻辑可以通过规则配置,也可以让大语言模型来做。
与LLM的集成
整套系统设计上是LLM-agnostic的,意思是你可以接入不同的大语言模型作为智能体的"大脑"。
英伟达官方支持的集成包括:
- 自家的BioNeMo LLM(针对生命科学微调过)
- Llama系列(通过NIM部署)
- 主流商业模型API
实际使用中,LLM负责:
- 理解用户的自然语言指令
- 制定实验计划
- 调用工具获取结果
- 综合分析并生成报告
专业工具负责:
- 精确的科学计算
- 领域特定的预测
- 数值模拟
这种分工很清晰:LLM擅长理解、推理、表达,但在精确计算上靠不住;专业模型计算准确,但不会"思考"。结合起来才能发挥作用。
"Lab-in-the-Loop":实验室闭环是什么概念
英伟达在之前的BioNeMo更新中提出过"Lab-in-the-Loop"(实验室闭环)的概念,这次的Agent Toolkit是对这个概念的进一步落地。
传统的AI辅助药物研发是这样的:
计算预测 → 人工筛选 → 实验验证 → 人工分析 → 调整模型
每个箭头都需要人来衔接,周期以周甚至月计。
Lab-in-the-Loop想实现的是:
计算预测 ←→ 自动筛选 ←→ 实验验证 ←→ 自动分析 ←→ 模型更新
↑_____________________________________________↓
整个循环自动运转,AI智能体作为协调者,连接计算和实验。
当然,完全自动化还很远。目前更现实的场景是:
- AI智能体完成计算侧的自动化
- 生成实验方案给人类科学家
- 科学家审核后执行实验
- 实验结果反馈给AI智能体
- AI智能体分析结果,更新策略
这种"半自动"模式已经能显著提升效率。英伟达引用的案例显示,一些合作伙伴的药物发现周期缩短了30-50%。

谁在用,效果怎么样
早期合作伙伴的反馈
BioNeMo平台已经有不少生命科学公司在用。根据英伟达在今年摩根大通医疗健康大会上披露的信息,合作伙伴包括:
Recursion
这家公司做的是AI驱动的药物发现,自建了大规模的细胞图像数据库。他们用BioNeMo来:
- 预测化合物的细胞表型效应
- 筛选先导化合物
- 优化分子结构
据称使用BioNeMo后,他们的虚拟筛选命中率提升了3倍。
Insilico Medicine
这家公司已经有AI设计的药物进入临床试验。他们用BioNeMo主要做:
- 新靶点发现
- 分子生成
- ADMET预测(吸收、分布、代谢、排泄、毒性)
Evozyne
专注于蛋白质工程。他们用BioNeMo的蛋白质结构预测和序列设计能力来开发新型酶。
这次Agent Toolkit的新玩家
具体采用Agent Toolkit的公司名单还没有公布,但从英伟达的描述看,目标用户包括:
- 大型药企的计算化学团队
- 生物技术初创公司
- 学术研究机构
- CRO(合同研究组织)
可以预期的是,已经在用BioNeMo的公司会是第一批尝试Agent Toolkit的用户。
和竞品比,BioNeMo Agent Toolkit的位置
生命科学AI平台赛道
这个赛道目前主要玩家包括:
Schrödinger
老牌计算化学公司,有30多年历史。他们的平台在制药行业认可度很高,但更偏传统的分子模拟,AI能力是近几年才加强的。没有智能体编排的概念。
Atomwise
专注于AI药物发现,用深度学习做分子筛选。模型能力强,但工具覆盖面不如BioNeMo广,也没有智能体框架。
Google DeepMind
有AlphaFold这个杀手级应用,在蛋白质预测领域无人能敌。但他们没有做成一个完整的药物发现平台,更像是提供单点能力。
Isomorphic Labs
DeepMind分拆出来专门做AI制药的公司,目前还比较神秘,产品没有公开发布。
BioNeMo的差异化
和这些竞品比,BioNeMo Agent Toolkit的独特之处在于:
1. 覆盖面广
从蛋白质到小分子到基因组,主要的生命科学计算方向都有覆盖。不是某个单点的最强,但胜在全面。
2. 统一的接口
所有工具都通过NIM微服务暴露标准API,对接成本低。竞品往往是各自为战,用户要自己做集成。
3. 智能体原生
这是目前最大的差异点。其他平台还在做"人用工具",BioNeMo已经开始做"AI用工具"。这个方向如果押对了,是代际的差距。
4. 算力优势
背靠英伟达,在GPU资源和优化上有天然优势。BioNeMo平台可以直接部署在DGX云上,不用操心基础设施。
潜在的问题
当然也有隐忧:
定价
BioNeMo的定价不透明,大型药企可能不在乎,但小型biotech公司可能觉得贵。Agent Toolkit作为增值服务,定价只会更高。
lock-in风险
一旦重度使用BioNeMo,迁移成本会很高。英伟达当然希望用户锁定在自己的生态里,但用户需要考虑这个风险。
智能体可靠性
让AI智能体自动做决策,出错了谁负责?在药物研发这种高风险领域,这是必须考虑的问题。目前BioNeMo Agent Toolkit的定位是"辅助"而非"替代",但边界在实际使用中可能会模糊。
对行业的影响:AI Agent在垂直领域的试金石
这次发布的意义不只是生命科学行业,更在于AI Agent落地垂直领域的示范效应。
为什么生命科学适合做Agent
选择生命科学作为Agent落地的领域,有几个原因:
1. 工具API化程度高
生命科学领域有大量成熟的计算工具,而且很多已经有API或者命令行接口。封装成Agent可调用的工具相对容易。
2. 任务分解清晰
药物发现的流程相对标准化:靶点验证→先导化合物发现→先导化合物优化→临床前研究。每个阶段的任务目标和成功标准都比较明确。
3. 容错空间存在
计算实验出错的成本是再跑一次,不像自动驾驶那样出错就是人命。这给了Agent试错和学习的空间。
4. 专家资源稀缺
有经验的计算化学家非常紧缺,人力瓶颈明显。用Agent扩展专家产能,ROI很清晰。
可能的示范效应
如果BioNeMo Agent Toolkit跑通了,可以预期其他垂直领域也会出现类似的产品:
- 材料科学:和药物发现逻辑类似,也是大量计算筛选+实验验证
- 芯片设计:EDA工具也在AI化,Agent编排是自然的下一步
- 化工流程:工艺优化、配方设计,工具API化程度也在提升
英伟达自己肯定也在想这些。BioNeMo证明了Agent+垂直领域工具的模式可行,复制到其他领域是顺理成章的事。
技术人员应该关注什么
如果你是开发者或者技术管理者,这次发布有几个点值得关注:
1. Agent编排的工程实践
英伟达怎么把专业工具封装成Agent可调用的形式,怎么设计工具选择和任务规划的逻辑,这些工程细节值得学习。虽然具体代码还没开源,但架构设计的思路可以参考。
2. 领域知识和通用能力的结合
BioNeMo Agent Toolkit展示了一种模式:用通用LLM做理解和规划,用专业模型做精确计算。这种分工在其他垂直领域也适用。
3. 工具标准化的趋势
要让AI Agent能用你的工具,首先工具得有标准化的接口。这会推动更多领域的工具API化、微服务化。如果你在做To B工具,这个趋势值得关注。
4. 可靠性和可解释性
Agent自动做决策,怎么保证可靠性?怎么让用户理解Agent的决策过程?BioNeMo在这方面的实践可以作为参考。
总结
英伟达发布BioNeMo Agent Toolkit,核心变化是:把生命科学工具从"人用"变成"AI用"。
技术上没有特别大的突破,更多是工程整合和产品化的工作。但这个方向是对的:在垂直领域,AI Agent的价值不是替代人类专家,而是扩展专家的产能。
对于生命科学行业,这可能是加速AI渗透的催化剂。对于整个AI行业,这是Agent在垂直领域落地的一个重要案例。
值得持续关注。
参考来源
暂无符合条件的国内可访问参考链接。
本文信息来源于英伟达官方新闻稿及公开报道,如需了解更多技术细节,建议访问NVIDIA Developer官方文档。


