AI 快讯英伟达放手让AI智能体训练机器人
行业快讯

英伟达放手让AI智能体训练机器人

2026-06-17T22:03:36.481Z

NVIDIA把Cosmos、Omniverse、Isaac等物理AI工具栈打包成可被Claude Code、Codex、Cursor调用的开源技能集,让编码智能体自己生成数据、跑仿真、训练机器人——连装GPU、剪扎带这种活都开始让机器人自学了。

英伟达把机器人训练流水线交给了编码智能体

6月17日,NVIDIA在台北 GTC 上把一整套"物理 AI 智能体技能与工具集"开源扔了出来。一句话概括这次发布:以前你用 Cursor 写 React 组件,现在 Cursor 可以替你跑机器人仿真、生成训练数据、评估策略模型——甚至教会一台机械臂怎么把 GPU 插进 PCIe 槽、怎么剪断主板上的扎带。

是的,Ars Technica 那篇报道的标题不是噱头:AI coding agents taught robots how to install GPUs and cut zip-ties。NVIDIA 自己在演示里就让 Claude Code 调度 Isaac Sim 训了一套"装显卡"的策略,这事的隐喻意味比技术意味还浓——黄仁勋让 AI 训练机器人,去组装下一代要跑 AI 的服务器。闭环。

这次发布到底是什么东西

别被"物理 AI 智能体技能"这种营销话术绕晕,拆开看其实就两层:

第一层是工具化(Tools)。 NVIDIA 把自家整套物理 AI 堆栈——Cosmos 世界模型、Omniverse 仿真库、Isaac 机器人学习框架、Metropolis 视觉 AI、Alpamayo 辅助驾驶、Jetson 边缘平台——全部包装成可以被编码智能体调用的工具接口。也就是说,原本这些库需要工程师手写 Python 脚本去拼,现在 Claude Code、Codex、Cursor 这类 agent 可以直接 function call。

第二层是技能化(Skills)。 工具是原子能力,技能是工作流。NVIDIA 把"准备一个仓库分拣场景"、"为某个抓取任务生成 10 万条合成轨迹"、"评估一个 VLA 模型在 50 种光照下的鲁棒性"这种典型开发流程,写成了智能体可以重复执行的 SOP——明确告诉 agent:第一步调哪个工具、第二步生成什么中间产物、第三步怎么验证。

东西已经放在 GitHub 和 skills.sh 上了,可以配任何编程智能体用。这一点其实比工具本身重要:NVIDIA 没有强推自己的 agent,而是认了 Anthropic、OpenAI、Cursor 三家的市场地位,做了个"中立适配"。

为什么是现在,为什么是 agent

搞机器人的人都知道一个矛盾:仿真训练的瓶颈从来不在算力,在人。

一个典型的机器人学习项目,研究员的时间分配大概是这样:30% 在 USD 里搭场景、调材质、放灯光;30% 在调 domain randomization 参数、写 reward function;20% 在跑 rollout、看 tensorboard;剩下 20% 才是真正改算法。Cosmos 也好、Isaac Lab 也好,能力上限早就够了,但每跑一个新任务就要一个博士折腾两周——这没法规模化。

NVIDIA 机器人副总裁 Deepu Talla 在更早一次访谈里把话说得很白:机器人行业还在等自己的 ChatGPT 时刻,而通用大脑迟迟出不来的核心瓶颈不是模型,是数据。数据从哪来?大规模仿真。谁来跑大规模仿真?人跑不动,得让 agent 跑。

这就是这次发布的真正逻辑——用 coding agent 把数据生产-训练-评估这条管线自动化。Anthropic 和 OpenAI 这一两年把 agent 在软件工程上的可靠性堆到了能干活的水准,NVIDIA 顺势把自家的 SDK 翻译成 agent 听得懂的语言,让通用 agent 直接变成机器人研究员的下手。

装 GPU 和剪扎带:两个 demo 的技术含量

回到那两个标题里的任务,看看智能体到底干了什么。

装 GPU 这事,难点不在抓握——机械臂抓个显卡是基本功——而在对位插入。PCIe 槽的容错只有零点几毫米,金手指方向插反就废了,用力过猛会撅断插槽。传统做法是手动收集几百次人类示教,加上 domain randomization 跑几天。

在新的工作流里,agent 干的活大概是这样:调 Isaac Sim 起一个数据中心机柜场景 → 调 Cosmos 生成不同型号显卡和主板的几何变体 → 调 Isaac Lab 跑分布式 PPO 训练抓取-插入策略 → 调评估技能跑 1000 次随机化测试 → 把失败案例反馈回去让 agent 自己调参重训。整个过程,人类工程师可能只需要一句"训一个能装 H100 的策略,目标成功率 95%"。

剪扎带就更有意思。这是一个典型的 deformable object(柔性物体)操控问题,扎带细、能形变、剪刀和扎带的接触点视觉上几乎看不见。这种任务过去是机器人学顶会论文级的难度。让 agent 端到端搞定不现实,但让 agent 把这个任务拆成可仿真的子问题、生成几十万条带物理模拟的轨迹——这件事 agent 现在能做。

顺带提一句,Talla 自己也承认了短板:机器人在精细物体操控和人机共存安全这两块还差得远。这次发布不是说问题解决了,是说研究迭代速度可以快一个量级

跟竞品比,NVIDIA 这步棋怎么样

横向看,物理 AI 这条赛道目前没有真正意义上的竞品。Google DeepMind 有 RT-2、Gemini Robotics 那条线,但偏模型本身;Figure、1X 这些机器人公司有自己的数据飞轮但不开放;亚马逊的 DeepFleet 是仓储调度方向,跟训练管线不是一个层。

NVIDIA 这次的打法是典型的**"卖铲子的人继续卖更高级的铲子"**:

  • 早期是卖 GPU 给你训机器人
  • 中期是卖 Omniverse + Isaac 给你搭仿真
  • 现在是把仿真本身也 agent 化,让你的 agent 调度它的仿真,跑在它的 GPU 上

商业上无懈可击。但有一个值得警惕的点:Cosmos 世界模型本身还没完全成熟。Talla 自己说 Cosmos 是"多个模型的集合,各项能力成熟度参差不齐",部分客户在等三到六个月后的下一版。把还在迭代的世界模型暴露成 agent 工具,意味着 agent 会撞上大量"工具行为不稳定"的情况——这是真正考验 agent 鲁棒性的地方。

再说一个细节。智能体目前能调用的 NVIDIA Osmo 软件,本质是个跨集群的机器学习编排平台。Claude Code 调它的意义在于:agent 不再是在你笔记本上写脚本,而是可以直接申请几百张 H100 跑分布式训练。这对 agent 的权限边界、成本控制提出了完全不同量级的要求,目前 NVIDIA 没披露太多治理细节,这块迟早要补课。

谁已经在用

名单很长,挑几个有信息量的说:

  • 机器人本体侧:1X、Agility Robotics、Universal Robots、NEURA Robotics、Skild AI、FieldAI——基本覆盖了人形和工业机械臂的第一梯队
  • 工业软件侧:西门子、达索、Cadence、新思科技——EDA 和 CAD 巨头全在场
  • 制造侧:富士康、和硕、台积电、SK 海力士——SK 海力士还在用 Omniverse 搭半导体晶圆厂的数字孪生

这个客户结构说明一件事:NVIDIA 的机器人故事不是赌人形机器人 C 端,而是赌制造业、半导体厂、汽车厂的存量自动化升级。这些场景任务边界清晰、ROI 算得明白,是 agent + 仿真这套工具链最先能跑通商业闭环的地方。

开发者视角:这玩意儿值得现在上手吗

如果你已经在用 Isaac Sim / Lab,强烈建议把这套 skills 接进来。最直接的收益是仿真场景搭建时间——根据 NVIDIA 自己给的数据,Isaac Lab-Arena 在新的工作流下,单 GPU 跑 1.3 天的训练,4 GPU 压到 12.5 小时,吞吐量提升带来的迭代效率改变是肉眼可见的。

如果你只是想体验 agent 调度机器人训练,可以从 skills.sh 上挑一个简单技能,配 Claude Code 跑起来。门槛比想象中低,因为技能本身就是 markdown 描述 + 工具调用清单,agent 拿过去就能执行。

但有几个坑要提前说:

  • 算力账要算清楚:让 agent 自动跑仿真,意味着 agent 的每一轮决策都可能烧掉几小时 GPU 时间。建议在 sandbox 里先限定 budget
  • Cosmos 调用要谨慎:世界模型这块还在快速迭代,agent 调用的接口可能下个月就变
  • 评估环节别全托管:让 agent 训练可以,但成功标准、安全约束这些必须人来定,不然 agent 会用各种你想不到的方式 reward hacking

顺带一提,OpenAI Hub 这边对 Claude、GPT、Gemini 三家主流 coding agent 背后的模型都做了直连兼容,国内开发者如果想用 Claude Code 跑这套 NVIDIA skills,省去了境外网络这一层麻烦。

一个更大的判断

NVIDIA 这次发布表面上是工具升级,本质上是承认了一个新的开发范式:物理 AI 的开发者不再是"会写 PyTorch 的人",而是"会指挥 agent 的人"。

这个范式迁移和当年云原生取代物理机运维是一个性质的事——技能栈整个换一轮。三年后再招机器人研究员,HR 大概率会在 JD 里写:熟练使用 Claude Code / Cursor 调度 Isaac Sim 工作流。听起来荒诞,但 GTC 台北这一周之后,路径已经很清楚了。

Talla 那句"机器人成群部署还差得远"是大实话,但 NVIDIA 显然不打算干等着。他们的算盘是:先把研究迭代速度拉起来一个量级,等数据飞轮转起来,通用大脑自然就出来了。这是英伟达式的耐心——只要算力、工具、生态三件事都握在手里,时间永远站在自己这边。

参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: