英伟达推出BioNeMo Agent Toolkit，将十余年生命科学积累封装成可被AI智能体调用的工具集，让大模型能够直接操作蛋白质预测、分子对接等专业计算，标志着AI Agent在垂直领域的落地进入新阶段。

英伟达发布BioNeMo Agent：AI智能体正式进入药物研发实验室

6月23日，英伟达正式发布NVIDIA BioNeMo Agent Toolkit。这不是又一个生命科学AI模型，而是一套让AI智能体能够"动手做实验"的工具包。

简单说：以前的AI在药物研发中只能回答问题，现在它可以自己跑计算、分析结果、给出下一步建议。

BioNeMo Agent Toolkit架构图，展示AI智能体与各类生命科学工具的交互关系

这次发布的核心是什么

不是新模型，是"工具箱"

BioNeMo本身不是新东西。英伟达从2022年开始就在做这个生命科学AI平台，陆续集成了蛋白质结构预测、分子生成、基因组分析等能力。

但之前的BioNeMo更像一个"模型仓库"——你有问题，调用对应的模型，拿到结果。整个流程是人在驱动。

这次的Agent Toolkit改变了这个逻辑。

英伟达把十多年积累的生命科学库、工具、开放模型重新封装，变成了一组可以被AI智能体调用的API。换句话说，现在一个大语言模型可以像使用计算器一样使用这些专业工具：

需要预测蛋白质结构？调用AlphaFold2或ESMFold
要做分子对接？调用DiffDock
生成新的候选分子？调用MolMIM
分析基因组数据？调用对应的分析工具

关键变化在于：决定调用什么、什么时候调用、怎么解读结果，这些判断现在可以由AI智能体来做。

从"人用工具"到"AI用工具"

传统的药物研发流程大概是这样：

科学家提出假设
设计实验
运行计算（可能用到各种AI模型）
分析结果
根据结果调整假设，回到步骤1

每一步都需要人来判断和决策。一个有经验的计算化学家可能同时跑几十个实验，但他的时间和精力是瓶颈。

BioNeMo Agent Toolkit想做的是：让AI智能体承担步骤2-4的大部分工作。

科学家说"我想找一个能结合这个靶点的小分子"，AI智能体可以：

分析靶点结构
生成一批候选分子
对每个候选分子做对接模拟
评估结合亲和力
筛选出最有希望的几个
给出理由和建议

整个过程自动进行，科学家只需要审核最终结果。

技术架构：怎么让AI智能体"懂"生命科学

工具调用层

这套Toolkit的底层是英伟达多年积累的NIM（NVIDIA Inference Microservices）微服务。每个专业能力都被封装成独立的服务：

蛋白质结构预测

AlphaFold2：DeepMind的明星模型，预测蛋白质三维结构
ESMFold：Meta的蛋白质语言模型，速度更快
OpenFold：开源实现，方便定制

分子生成与优化

MolMIM：英伟达自研的分子生成模型
REINVENT：基于强化学习的分子优化
支持SMILES、分子图等多种表示

分子对接

DiffDock：基于扩散模型的对接预测
AutoDock-GPU：经典对接工具的GPU加速版

基因组分析

单细胞RNA测序分析
变异检测
生物标志物发现

每个服务都有标准化的API接口，输入输出格式统一。这是让AI智能体能够调用它们的基础。

智能体编排层

光有工具不够，还需要让AI智能体知道怎么用这些工具。

BioNeMo Agent Toolkit提供了一套编排框架，核心包括：

任务规划器（Task Planner）

接收高层次的研究目标，分解成具体的计算任务。比如"评估这个化合物的成药性"会被分解为：

预测溶解度
预测代谢稳定性
预测毒性
预测合成可行性

工具选择器（Tool Selector）

根据任务类型选择合适的工具。有些任务有多个工具可选，选择器会根据精度要求、计算资源、时间限制等因素做出选择。

结果解释器（Result Interpreter）

把专业工具的输出转化为可理解的分析。一个对接分数-8.5 kcal/mol意味着什么？这个亲和力在已知药物中处于什么水平？结果解释器负责提供这些上下文。

决策引擎（Decision Engine）

根据当前结果决定下一步行动。如果对接分数不够好，是调整分子结构重新生成，还是换一个靶点口袋？这个判断逻辑可以通过规则配置，也可以让大语言模型来做。

与LLM的集成

整套系统设计上是LLM-agnostic的，意思是你可以接入不同的大语言模型作为智能体的"大脑"。

英伟达官方支持的集成包括：

自家的BioNeMo LLM（针对生命科学微调过）
Llama系列（通过NIM部署）
主流商业模型API

实际使用中，LLM负责：

理解用户的自然语言指令
制定实验计划
调用工具获取结果
综合分析并生成报告

专业工具负责：

精确的科学计算
领域特定的预测
数值模拟

这种分工很清晰：LLM擅长理解、推理、表达，但在精确计算上靠不住；专业模型计算准确，但不会"思考"。结合起来才能发挥作用。

"Lab-in-the-Loop"：实验室闭环是什么概念

英伟达在之前的BioNeMo更新中提出过"Lab-in-the-Loop"（实验室闭环）的概念，这次的Agent Toolkit是对这个概念的进一步落地。

传统的AI辅助药物研发是这样的：

计算预测 → 人工筛选 → 实验验证 → 人工分析 → 调整模型

每个箭头都需要人来衔接，周期以周甚至月计。

Lab-in-the-Loop想实现的是：

计算预测 ←→ 自动筛选 ←→ 实验验证 ←→ 自动分析 ←→ 模型更新
        ↑_____________________________________________↓

整个循环自动运转，AI智能体作为协调者，连接计算和实验。

当然，完全自动化还很远。目前更现实的场景是：

AI智能体完成计算侧的自动化
生成实验方案给人类科学家
科学家审核后执行实验
实验结果反馈给AI智能体
AI智能体分析结果，更新策略

这种"半自动"模式已经能显著提升效率。英伟达引用的案例显示，一些合作伙伴的药物发现周期缩短了30-50%。

Lab-in-the-Loop工作流示意图，展示AI智能体在计算与实验之间的协调角色

谁在用，效果怎么样

早期合作伙伴的反馈

BioNeMo平台已经有不少生命科学公司在用。根据英伟达在今年摩根大通医疗健康大会上披露的信息，合作伙伴包括：

Recursion

这家公司做的是AI驱动的药物发现，自建了大规模的细胞图像数据库。他们用BioNeMo来：

预测化合物的细胞表型效应
筛选先导化合物
优化分子结构

据称使用BioNeMo后，他们的虚拟筛选命中率提升了3倍。

Insilico Medicine

这家公司已经有AI设计的药物进入临床试验。他们用BioNeMo主要做：

新靶点发现
分子生成
ADMET预测（吸收、分布、代谢、排泄、毒性）

Evozyne

专注于蛋白质工程。他们用BioNeMo的蛋白质结构预测和序列设计能力来开发新型酶。

这次Agent Toolkit的新玩家

具体采用Agent Toolkit的公司名单还没有公布，但从英伟达的描述看，目标用户包括：

大型药企的计算化学团队
生物技术初创公司
学术研究机构
CRO（合同研究组织）

可以预期的是，已经在用BioNeMo的公司会是第一批尝试Agent Toolkit的用户。

和竞品比，BioNeMo Agent Toolkit的位置

生命科学AI平台赛道

这个赛道目前主要玩家包括：

Schrödinger

老牌计算化学公司，有30多年历史。他们的平台在制药行业认可度很高，但更偏传统的分子模拟，AI能力是近几年才加强的。没有智能体编排的概念。

Atomwise

专注于AI药物发现，用深度学习做分子筛选。模型能力强，但工具覆盖面不如BioNeMo广，也没有智能体框架。

Google DeepMind

有AlphaFold这个杀手级应用，在蛋白质预测领域无人能敌。但他们没有做成一个完整的药物发现平台，更像是提供单点能力。

Isomorphic Labs

DeepMind分拆出来专门做AI制药的公司，目前还比较神秘，产品没有公开发布。

BioNeMo的差异化

和这些竞品比，BioNeMo Agent Toolkit的独特之处在于：

1. 覆盖面广

从蛋白质到小分子到基因组，主要的生命科学计算方向都有覆盖。不是某个单点的最强，但胜在全面。

2. 统一的接口

所有工具都通过NIM微服务暴露标准API，对接成本低。竞品往往是各自为战，用户要自己做集成。

3. 智能体原生

这是目前最大的差异点。其他平台还在做"人用工具"，BioNeMo已经开始做"AI用工具"。这个方向如果押对了，是代际的差距。

4. 算力优势

背靠英伟达，在GPU资源和优化上有天然优势。BioNeMo平台可以直接部署在DGX云上，不用操心基础设施。

潜在的问题

当然也有隐忧：

定价

BioNeMo的定价不透明，大型药企可能不在乎，但小型biotech公司可能觉得贵。Agent Toolkit作为增值服务，定价只会更高。

lock-in风险

一旦重度使用BioNeMo，迁移成本会很高。英伟达当然希望用户锁定在自己的生态里，但用户需要考虑这个风险。

智能体可靠性

让AI智能体自动做决策，出错了谁负责？在药物研发这种高风险领域，这是必须考虑的问题。目前BioNeMo Agent Toolkit的定位是"辅助"而非"替代"，但边界在实际使用中可能会模糊。

对行业的影响：AI Agent在垂直领域的试金石

这次发布的意义不只是生命科学行业，更在于AI Agent落地垂直领域的示范效应。

为什么生命科学适合做Agent

选择生命科学作为Agent落地的领域，有几个原因：

1. 工具API化程度高

生命科学领域有大量成熟的计算工具，而且很多已经有API或者命令行接口。封装成Agent可调用的工具相对容易。

2. 任务分解清晰

药物发现的流程相对标准化：靶点验证→先导化合物发现→先导化合物优化→临床前研究。每个阶段的任务目标和成功标准都比较明确。

3. 容错空间存在

计算实验出错的成本是再跑一次，不像自动驾驶那样出错就是人命。这给了Agent试错和学习的空间。

4. 专家资源稀缺

有经验的计算化学家非常紧缺，人力瓶颈明显。用Agent扩展专家产能，ROI很清晰。

可能的示范效应

如果BioNeMo Agent Toolkit跑通了，可以预期其他垂直领域也会出现类似的产品：

材料科学：和药物发现逻辑类似，也是大量计算筛选+实验验证
芯片设计：EDA工具也在AI化，Agent编排是自然的下一步
化工流程：工艺优化、配方设计，工具API化程度也在提升

英伟达自己肯定也在想这些。BioNeMo证明了Agent+垂直领域工具的模式可行，复制到其他领域是顺理成章的事。

技术人员应该关注什么

如果你是开发者或者技术管理者，这次发布有几个点值得关注：

1. Agent编排的工程实践

英伟达怎么把专业工具封装成Agent可调用的形式，怎么设计工具选择和任务规划的逻辑，这些工程细节值得学习。虽然具体代码还没开源，但架构设计的思路可以参考。

2. 领域知识和通用能力的结合

BioNeMo Agent Toolkit展示了一种模式：用通用LLM做理解和规划，用专业模型做精确计算。这种分工在其他垂直领域也适用。

3. 工具标准化的趋势

要让AI Agent能用你的工具，首先工具得有标准化的接口。这会推动更多领域的工具API化、微服务化。如果你在做To B工具，这个趋势值得关注。

4. 可靠性和可解释性

Agent自动做决策，怎么保证可靠性？怎么让用户理解Agent的决策过程？BioNeMo在这方面的实践可以作为参考。

总结

英伟达发布BioNeMo Agent Toolkit，核心变化是：把生命科学工具从"人用"变成"AI用"。

技术上没有特别大的突破，更多是工程整合和产品化的工作。但这个方向是对的：在垂直领域，AI Agent的价值不是替代人类专家，而是扩展专家的产能。

对于生命科学行业，这可能是加速AI渗透的催化剂。对于整个AI行业，这是Agent在垂直领域落地的一个重要案例。

值得持续关注。

参考来源

暂无符合条件的国内可访问参考链接。

本文信息来源于英伟达官方新闻稿及公开报道，如需了解更多技术细节，建议访问NVIDIA Developer官方文档。

英伟达发布BioNeMo Agent：AI智能体正式进入药物研发实验室

英伟达发布BioNeMo Agent：AI智能体正式进入药物研发实验室

这次发布的核心是什么

不是新模型，是"工具箱"

从"人用工具"到"AI用工具"

技术架构：怎么让AI智能体"懂"生命科学

工具调用层

智能体编排层

与LLM的集成

"Lab-in-the-Loop"：实验室闭环是什么概念

谁在用，效果怎么样

早期合作伙伴的反馈

这次Agent Toolkit的新玩家

和竞品比，BioNeMo Agent Toolkit的位置

生命科学AI平台赛道

BioNeMo的差异化

潜在的问题

对行业的影响：AI Agent在垂直领域的试金石

为什么生命科学适合做Agent

可能的示范效应

技术人员应该关注什么

1. Agent编排的工程实践

2. 领域知识和通用能力的结合

3. 工具标准化的趋势

4. 可靠性和可解释性

总结

参考来源

相关推荐

Aiide接入百炼与火山，国产模型聚合战正式开打

扩散模型杀入文本生成：谷歌开源DiffusionGemma

Modal 推出 Auto Endpoints：开发者自托管的推理黑科技

联系我们