黄仁勋:AI工厂时代来了

英伟达CEO黄仁勋在股东大会上宣告智能体时代正式到来,将其定性为60年来最大的计算范式转变。数据中心正从存储文件转向生产token,英伟达推出专为智能体设计的Vera CPU,并警告走私芯片拼凑数据中心是"死路一条"。
黄仁勋:AI工厂时代来了
昨天的英伟达年度股东大会上,黄仁勋说了一句狠话:智能体时代正式到来,这是60年来规模最大的行业重置。
不是画饼。他拿出了数据——GitHub的pull request数量从2024年的4亿涨到2025年的5亿,今年头几个月又翻了近三倍。代码在以前所未有的速度被生产出来,而背后站着的不再只是人类程序员。
数据中心变了:不存文件,生产token
黄仁勋提出了一个核心观点:传统数据中心存储和传输文件的时代已成过去,新型数据中心的核心功能是生产token。
这个转变值得细说。
过去二十年,数据中心的商业模式很简单——你存多少数据、用多少带宽、租多少机柜,按量付费。但AI时代的逻辑完全不同。企业购买算力不是为了存东西,而是为了让机器"想"东西。每生成一个token,就是在创造价值——可能是一段代码、一份报告、一个设计方案,或者一个能自主执行任务的智能体。
黄仁勋把这种新型数据中心命名为"AI工厂"。工厂的核心指标不再是存储容量或网络带宽,而是每瓦特能产出多少token、每个token的成本有多低。

他用"五层蛋糕"来描述AI产业生态:
- 底层:能源 —— AI工厂是吃电大户,电力成本直接决定运营效率
- 第二层:芯片与系统 —— GPU、CPU、网络设备的协同
- 第三层:基础设施 —— 数据中心的整体架构和运维
- 第四层:模型 —— 基础大模型和垂直领域模型
- 顶层:应用 —— 直接创造商业价值的智能体和AI服务
这个框架暴露了英伟达的野心:它不想只卖芯片,而是要吃下整个AI生产链条。
Blackwell的实力:推理吞吐量是第二名的30倍
股东大会上,黄仁勋援引了Semi Analysis Inference X基准测试的结果:Blackwell平台被认定为"推理之王",token吞吐量比次优平台高出30倍。
30倍是什么概念?
假设你用竞品芯片跑一个智能体应用,每秒能处理100个并发请求;换成Blackwell,理论上能处理3000个。对于按token计费的AI服务商来说,这直接意味着收入能力的数量级差距。
更关键的是客户名单的变化。黄仁勋点名的企业包括Capital One(金融)、现代汽车(制造)、Jane Street(量化交易)、礼来(制药)。这意味着AI工厂的客户群已经从AWS、Azure、Google Cloud这些超大规模云厂商,扩展到了传统行业巨头。
银行要用AI做风控和客服,车企要用AI搞自动驾驶和智能座舱,药企要用AI加速药物发现——这些需求在过去是"有就好",现在变成了"没有就死"。
Vera CPU:专门为智能体设计的处理器
这次股东大会上最有意思的内容,是黄仁勋对Vera Rubin平台的定位。他称其为英伟达公司历史上"最重要的产品发布之一"。
为什么?因为Vera CPU不是为人类设计的,而是专门为智能体设计的。
这个区分很重要。
过去所有CPU的设计思路都基于一个假设:用户是人类。人类的反应速度以毫秒计,所以CPU可以按核心数量切片租用,多任务并行处理。但智能体不一样——它们"活"在纳秒级的计算世界里。
当一个智能体需要调用工具、访问数据库、执行代码、反复迭代任务时,任何一个环节的延迟都会产生连锁反应。如果CPU成为瓶颈,造价高昂的GPU就会陷入闲置。每一秒闲置,都意味着AI工厂收入的损耗。
黄仁勋的原话是:智能体对核心数量并无诉求,但对超低延迟响应有极致要求。
这解释了为什么英伟达要从头构建一款CPU。市面上的x86和Arm处理器都是为人类优化的,没有人专门为智能体的工作模式做过架构设计。Vera CPU填补了这个空白——根据黄仁勋的说法,它比x86处理器快1.8倍。
更大的图景是:随着全球智能体数量将达数十亿规模,这是一个全新的CPU市场。英伟达不想把这块蛋糕让给Intel或AMD。
CUDA生态:英伟达的"皇冠珠宝"
股东大会上,黄仁勋把CUDA X库生态体系称为英伟达的"皇冠珠宝"。
这个说法并不夸张。
芯片行业有个残酷的事实:硬件性能再强,没有软件生态也是废铁。AMD的GPU性能在很多场景下不输英伟达,但市场份额差距依然悬殊,核心原因就是CUDA生态的护城河。
黄仁勋解释了英伟达的飞轮效应:
- 统一架构积累庞大的安装基础
- 安装基础吸引开发者
- 开发者创造突破性应用
- 应用开拓新市场
- 新市场进一步扩大安装基础
这个循环已经运转了十几年,CUDA目前支持超过7000个应用。对于想要挑战英伟达的竞争对手来说,要打破的不是某一款芯片的性能优势,而是整个生态系统的网络效应。
更值得关注的是CUDA的演进方向。黄仁勋在大会上宣布推出BioNeMo——一套专为智能体设计的数字生物学与药物发现工具套件。这标志着CUDA X库正从面向人类开发者的工具集,转型为智能体的工具箱。
换句话说,未来写代码的可能不是人类程序员调用CUDA,而是智能体在调用。英伟达提前为这个场景做了准备。
走私芯片?"死路一条"
黄仁勋在大会上罕见地公开谈到了芯片走私问题,措辞相当强硬:靠少量走私产品"东拼西凑"出数据中心,是一条"死路"。
这番话的背景是美国对华芯片出口管制。一些企业试图通过灰色渠道获取受限芯片,搭建自己的AI基础设施。黄仁勋直接否定了这条路的可行性。
他的逻辑是:先进AI数据中心不是零散硬件的简单堆叠。在实际落地场景下,需要搭建可信硬件、软件、网络和持续支持,形成大规模一体化系统。而英伟达不向受限产品提供任何支持或维修服务。
翻译一下:就算你搞到了芯片,没有官方支持,系统跑不起来;跑起来了,出了问题没人修;修好了,新版本软件不兼容。这是一个持续烧钱但没有产出的无底洞。
在中国市场问题上,黄仁勋的表态相当谨慎。他透露美国政府已批准H200芯片向中国客户出口的许可证,但英伟达迄今尚未产生任何相关收入,且对产品能否顺利进口仍存在不确定性。
他同时强调了自己的立场:在商业利益与美国国家安全存在冲突时,国家安全优先。
物理AI:下一轮增长引擎
除了智能体AI,黄仁勋还花了不少篇幅谈物理AI(Physical AI)。
物理AI是指具有物理形态、能在真实世界中感知并执行动作的人工智能,也叫具身AI(Embodied AI)。简单说就是机器人、自动驾驶车辆、工业自动化系统这些能"动"的AI。
黄仁勋表示,越来越多的企业已着手部署物理AI,这将成为英伟达下一轮增长机会。
这个判断有数据支撑。今年以来,人形机器人赛道的融资热度持续上升,特斯拉Optimus、Figure、1X等公司的进展不断。自动驾驶领域,尽管Robotaxi的商业化进度比预期慢,但技术路线正在逐渐收敛。
对英伟达来说,物理AI意味着新的芯片需求——机器人需要端侧推理芯片,自动驾驶需要车载计算平台,工业自动化需要边缘AI设备。这些场景对实时性、功耗、可靠性的要求与云端数据中心完全不同,需要专门的产品线。
英伟达已经在布局。Jetson系列面向机器人和边缘AI,DRIVE系列面向自动驾驶,Isaac平台提供机器人开发框架。如果物理AI真的爆发,英伟达又是准备最充分的那个。
财务数据:960亿美元自由现金流
最后看一下数字。
黄仁勋在大会上披露,英伟达过去一年营收增长65%,营业利润增长60%。2026财年自由现金流超过960亿美元。他重申,未来几年公司计划把50%的自由现金流通过股票回购和分红返还给投资者。
960亿美元是什么概念?这个数字超过了绝大多数科技公司的市值。英伟达不只是在赚钱,而是在以一种近乎疯狂的速度积累现金。
但股价表现却没那么亮眼。受AI需求推动,英伟达股价在2024年暴涨超过240%,2025年又涨了逾50%,但今年以来只涨了6.7%,跑输标普500指数同期7.5%的涨幅。
市场在担心什么?
焦点已经从短期业绩转向AI基础设施投资周期能够持续多久。云厂商和企业客户已经在AI上砸了大量资金,这些投入能否转化为实际收益?如果AI应用的商业化不及预期,算力需求会不会出现拐点?
黄仁勋的回答是:AI投资回报问题"已经有答案"。当AI输出能直接创造价值时,运行英伟达系统生成token就具备盈利性。GitHub pull request数量的爆发式增长,就是AI正在实际创造价值的证明。
对开发者意味着什么
从这次股东大会的信息来看,有几个趋势值得开发者关注:
智能体开发将成为主流。黄仁勋反复强调智能体时代的到来,这意味着从"调用API获取回答"到"构建能自主执行任务的系统"的范式转变。掌握智能体开发框架(LangChain、AutoGen、CrewAI等)会越来越重要。
推理优化比训练更关键。当AI工厂的核心指标变成token生产效率,推理侧的优化就成了刚需。量化、剪枝、KV Cache优化、投机解码等技术会越来越吃香。
端云协同是未来方向。英伟达推出RTX Spark进军PC市场,微软在Build大会上展示Windows设备到Azure云的统一智能体技术栈,都指向同一个方向:AI不会只跑在云端,端侧算力会承担越来越多的任务。
生态绑定会越来越深。CUDA生态的护城河已经很深了,随着CUDA X向智能体场景迁移,这个绑定会更紧。想要脱离英伟达生态另起炉灶,成本会越来越高。
对于使用多模型API的开发者来说,关注不同模型在推理效率上的差异会变得更有价值。同样的功能,用token成本更低的模型实现,在商业上会更有竞争力。像OpenAI Hub这样支持一个Key调用GPT、Claude、Gemini、DeepSeek等多种模型的平台,在对比和切换模型时会更方便。
黄仁勋把这次计算范式转变定性为60年来规模最大的行业重置。60年前是大型机时代的起点,之后经历了PC革命、互联网革命、移动互联网革命。每一次转变都诞生了新的巨头,也淘汰了一批跟不上节奏的玩家。
这一次,游戏才刚刚开始。
参考来源:
- 英伟达黄仁勋:AI 工厂时代来临,智能体重塑计算格局 - IT之家 —— 股东大会核心内容报道
- 黄仁勋GTC2026 台北主题演讲:智能体时代的算力革命与AI - 知乎 —— GTC台北演讲技术细节分析



