JetPack 7.2 把 Agentic AI 塞进了 Jetson

产品更新

NVIDIA 在 COMPUTEX 2026 推出 JetPack 7.2,给 Jetson 端侧设备带来 Agentic AI 技能、NemoClaw 智能体框架支持,以及 CUDA 13、MIG 等一票硬核更新。AI 智能体正在从云端走向物理世界。

Jetson 不再只是跑模型,它要自己干活了

6 月 2 日,COMPUTEX 2026 第一天,NVIDIA 把今年 Jetson 这条线最重要的更新一次性甩了出来:JetPack 7.2 正式发布,同时官宣 Jetson 平台支持 NemoClaw——也就是 NVIDIA 三月份在 GTC 上力推的那套 OpenClaw 智能体栈。

这件事的信号意义比技术细节本身更值得说。过去一年多 Agentic AI 一直在云上打转,Cursor、Devin、Manus、各家 Claude/GPT 包一层的 Agent,本质上都是数据中心里的玩家。而 Jensen 这次的明牌很清楚:让 Agent 跑下来,跑到边缘设备里,跑到机器人、工业相机、车载控制器、AGV 上。用他自己 GTC 上那句被反复引用的话——"每家公司都需要一个 OpenClaw 策略"——配上 Jetson,意思就完整了:每个设备也都需要一个。

NVIDIA JetPack 7.2 发布现场 Jensen Huang 介绍 Jetson 平台 Agentic AI 路线图

JetPack 7.2 到底更新了什么

先把这次发布的几个硬变化列清楚,再展开聊为什么重要。

  • Agentic AI 技能(Agentic AI Skills):JetPack 内置了一套面向 Agent 的 SDK 与运行时模块,覆盖感知、规划、工具调用三个层级。
  • NemoClaw 原生支持:可以直接在 Jetson 上拉起 OpenClaw runtime + Nemotron 模型,单条命令完成部署。
  • CUDA 13 落地 Jetson Orin:这是 Jetson 线第一次跟桌面/数据中心 CUDA 版本对齐,意味着 PyTorch、TensorRT、各种 kernel 库的版本鸿沟基本被填平。
  • Yocto Project 支持:终于。做嵌入式产品化的人会懂这意味着什么——以前 Jetson 出货定制系统要自己折腾 L4T 镜像,现在可以走 Yocto 标准流程了。
  • AGX Orin 32GB 模组性能提升:NVIDIA 没给具体数字,只说"substantial gain",根据现场 PPT 截图,推理吞吐大概在 1.4×–1.7× 之间,应该是软件栈优化吃下来的红利。
  • MIG(Multi-Instance GPU)支持:这条以前是数据中心 GPU 才有的特性,现在下放到 Jetson。一块 GPU 切成多个隔离实例,让一台设备上同时跑感知模型、规划模型、安全监控 Agent 互不干扰。

看下来,这次更新的核心逻辑很清楚:让 Jetson 从一台"跑 AI 模型的盒子",变成一台"能跑多 Agent 系统的边缘计算节点"

NemoClaw 是什么,为什么重要

上下文先补一下。OpenClaw 是过去半年开源圈窜得最猛的项目,定位是"开源版的 Agent 操作系统",提供记忆、规划、工具调用、自我学习的统一抽象层。Jensen 在 GTC 主题演讲里直接称它是"史上增长最快的开源项目"。

NemoClaw 是 NVIDIA 在 OpenClaw 之上做的企业级封装,关键加了三件事:

  1. 安全边界:把 Agent 的工具调用、文件访问、网络请求统统包在沙箱里,类似给 Agent 套了一层 SELinux。
  2. 隐私控制:本地模型与云端模型混合调用时的数据流向管控,敏感数据可以强制只走本地。
  3. 一键安装nemoclaw install 就能把 Nemotron 模型 + OpenShell runtime 一起拉起来,社区里已经有人验证过在 Jetson AGX Thor 上跑通的完整流程。

之前 NemoClaw 主要面向 DGX Spark、DGX Station 和 RTX PC,能力其实是"在你自己电脑上跑一个永远在线的 AI 助手"。这次把支持范围扩到 Jetson,意味着这个"永远在线的助手"可以塞进任何嵌入式形态——机械臂控制器、家用机器人、园区巡逻车、工厂边的检测站。

Agentic AI 跑在边缘,到底有什么不一样

这里有必要展开聊一下。Agent 跑在云上和跑在边缘,看起来都是"调模型、调工具、做决策",但工程约束完全不同。

延迟:云端 Agent 的一次 reasoning 循环动辄秒级,因为要走网络往返加大模型推理。边缘 Agent 干的活很多是控制类的——抓取物体、避障、跟人对话——超过 200ms 体验就崩了。所以 Jetson 这边的 Agentic 栈必须能用小模型(Nemotron Nano 之类)做大部分决策,只在复杂规划时回云端。

断网容忍:物理世界的 Agent 不能假设网络永远在。工厂里、地下室里、野外作业,断网是常态。这就要求 Agent 的核心记忆、规划能力、工具调用都得能本地闭环跑。NemoClaw 的本地+云端混合架构,本质就是为这个场景设计的。

多 Agent 协作:一个机器人可能同时跑 5 个 Agent——视觉感知一个、SLAM 定位一个、任务规划一个、人机对话一个、安全监控一个。它们要共享 GPU、共享内存、共享传感器数据,但又不能互相污染状态。MIG 这次下放到 Jetson,正是冲着这个场景去的。

这三个约束加起来,决定了"边缘 Agentic AI"不是"云端 Agent 换个地方跑"那么简单。NVIDIA 在 JetPack 7.2 里给的是一整套基础设施,而不只是一个 SDK。

CUDA 13 对 Jetson 用户意味着什么

这条更新看着不起眼,但实际影响可能是这次最大的。

做过 Jetson 开发的都知道一个老问题:JetPack 自带的 CUDA 版本总是滞后桌面端一两个大版本。结果就是你在 RTX 4090 上写好的代码,挪到 Jetson Orin 上跑,一半依赖装不上,TensorRT 版本不匹配,PyTorch wheel 找不到对应版本。整个边缘部署流程被这道版本鸿沟坑了无数团队。

CUDA 13 这次直接落 Orin,意味着:

  • 桌面端最新的 PyTorch、JAX、Triton 几乎可以无缝迁移
  • TensorRT 10.x、cuDNN 9.x 的新算子在 Jetson 上能直接用
  • 模型量化、稀疏化的新工具链不用再为 Jetson 单独适配

这对要把云端验证好的模型快速部署到边缘的团队,是实打实的工程效率提升。

Yocto 进来了,工业客户终于能松一口气

这是另一条容易被忽略但很关键的更新。

Jetson 一直有个尴尬定位——既想当开发板(用 L4T 这个基于 Ubuntu 的镜像),又想当工业模组(需要可定制、可裁剪、可长期维护的系统镜像)。结果就是工业客户做产品化的时候必须自己花大量精力把 L4T 改造成符合生产要求的固件。

Yocto 是嵌入式 Linux 的事实标准,从汽车到工业网关,所有正规嵌入式产品基本都走这条路。JetPack 7.2 正式支持 Yocto 之后,做 Jetson 模组产品化的厂商可以:

  • 用标准 BSP 流程构建定制镜像
  • 直接复用现有 Yocto layer 生态
  • 走标准的安全更新、签名启动流程
  • 满足 ISO 26262、IEC 61508 之类的功能安全认证

说人话就是,NVIDIA 终于承认 Jetson 不只是给开发者玩的,要正经做进工业产品里。

一些值得提的细节

  • AGX Thor 的角色:Thor 是去年发布的下一代 Jetson 旗舰,专门针对人形机器人和自动驾驶。NemoClaw 在 Thor 上的演示是这次发布的重点 demo,社区里已经能看到本地 LLM + NemoClaw 在 Thor 上跑通的实测视频。
  • Nemotron 模型的本地化:JetPack 7.2 默认带 Nemotron Nano 系列的优化版本,针对 Orin 系列做了 INT4 量化,AGX Orin 64GB 上能跑到约 30 tok/s。
  • OpenShell runtime:这是 NVIDIA 在 GTC 同期发布的 Agent 执行环境,定位类似于"Agent 的 systemd"——管理 Agent 进程、调度资源、处理通信。这次也跟着进了 Jetson。
  • MIG 的实际切分粒度:根据现场资料,AGX Orin 上最多可以切 4 个实例,每个实例独立的内存与 SM 配额。这对多模型并发部署是真有用。

一点判断

这次更新真正的看点不是某一项功能,而是 NVIDIA 把云端的整套"Agent 工程范式"——模型、运行时、安全、调度——一次性下放到了边缘。这件事的潜在影响面很大:机器人公司不再需要自己从零搭 Agent 框架,可以直接拿 NemoClaw 改;工业厂商可以把"自适应控制"的剧本从 PLC 写法切换到 Agent 写法;汽车 Tier 1 可以把座舱 AI 助手做得更像一个真正的助手而不是话筒。

当然也有几个待观察点:NemoClaw 的实际性能开销、Nemotron 模型在嵌入式场景下的能力下限、以及 NVIDIA 这套栈对非 Jetson 边缘平台(比如基于 ARM SoC 的国产方案)会不会形成新的生态壁垒。这些得等更多团队跑过真实项目才能给结论。

短期看,已经在用 Jetson 的团队建议升级试一下 JetPack 7.2 ——光是 CUDA 13 对齐和 Yocto 支持这两条,就值得跑一遍迁移。要做 Agent 类应用的,可以直接拿 NemoClaw 起步,比从 LangGraph、AutoGen 那套云端框架往下啃要顺得多。

Agentic AI 从屏幕走进物理世界这件事,这次算是真的开了个口子。

参考来源