OpenAI亲自下场造芯,英伟达该紧张了

OpenAI与博通联合发布首款自研推理芯片Jalapeño,未来四年将部署10吉瓦算力。这不只是一颗芯片,而是OpenAI摆脱英伟达依赖、掌控AI基础设施命脉的关键一步。
OpenAI亲自下场造芯,英伟达该紧张了
6月24日,OpenAI和博通(Broadcom)联合发布了一颗芯片。
名字很有意思——Jalapeño,墨西哥辣椒。辣不辣先不说,但这颗芯片的信号足够刺激:OpenAI终于有了自己的硅片。
这是一颗专门为大规模语言模型推理设计的AI加速器,是双方多代计算平台合作的第一款产品。根据《华尔街日报》披露的协议细节,两家公司将在未来四年内合作开发和部署10吉瓦的定制AI芯片和计算系统。
10吉瓦是什么概念?大约相当于10座大型核电站的输出功率。这不是在造芯片,这是在建发电厂级别的算力基础设施。

为什么是现在?
答案很简单:钱和货。
Sam Altman 早就公开抱怨过两件事:英伟达GPU短缺,以及运行这些硬件的成本"令人眼花缭乱"。
这不是客套话。OpenAI是英伟达最大的客户之一,从2020年开始就在微软建造的超级计算机上训练模型,那台机器用了10000块英伟达GPU。到了GPT-4时代,这个数字翻了好几倍。而现在,随着GPT-5系列的迭代和ChatGPT用户量的爆炸式增长,推理侧的算力消耗已经远超训练。
这里需要区分两个概念:训练和推理。
训练是教模型学会能力,一次性投入巨大算力,完成后模型权重固定。推理是让模型干活,每次用户提问都要消耗算力,量级小但频次极高。对于ChatGPT这种日活过亿的产品,推理成本才是真正的无底洞。
英伟达的GPU是通用型选手,训练推理都能干,但"都能干"往往意味着"都不是最优解"。专门为推理设计的芯片,可以在特定工作负载下实现更高的能效比——同样的电费,跑更多的请求。
Google很早就想明白了这件事。TPU(Tensor Processing Unit)从2015年就开始研发,如今已经迭代到第五代,支撑着Google搜索、YouTube推荐和Gemini模型的推理需求。微软也在2023年发布了Maia 100,专门为Azure云上的AI推理优化。亚马逊有Inferentia和Trainium。Meta也在搞自己的芯片。
整个大厂圈子里,OpenAI是最后一个还在完全依赖外购芯片的玩家。
现在它补上了这一课。
Jalapeño到底是什么?
从目前公开的信息来看,Jalapeño是一颗ASIC(专用集成电路),不是GPU,也不是通用处理器。
它的设计目标非常明确:在大规模LLM推理场景下,提供比通用GPU更高的吞吐量和更低的单位成本。具体的架构细节还没有完全披露,但根据合作模式推测,这颗芯片大概率采用了以下技术路线:
1. 专为Transformer优化的计算单元
现代LLM几乎都是基于Transformer架构,核心运算是矩阵乘法和注意力计算。通用GPU为了兼容各种工作负载,设计上有很多"浪费"。专用ASIC可以把晶体管全部投入到Transformer最需要的运算上,砍掉不需要的功能模块。
2. 大容量高带宽显存
推理的瓶颈往往不是算力,而是显存带宽。模型越大,参数越多,每次推理需要从显存读取的数据量越大。Jalapeño大概率配备了大容量HBM(高带宽存储器),并针对LLM的访存模式做了优化。
3. 机架级系统集成
根据知乎上的信息,这次合作的范围"远不止一颗芯片"。博通提供了端到端的以太网、PCIe和光连接解决方案,是一个完整的机架级系统。这意味着OpenAI不只是在设计芯片,而是在设计整个数据中心的算力单元。
芯片本身再强,如果网络互联跟不上,大规模部署时就会遇到瓶颈。这种全栈式的合作模式,说明OpenAI在基础设施层面的野心不小。
4. 台积电代工
芯片设计是一回事,制造是另一回事。根据此前的报道,Jalapeño将由台积电代工,预计2026年下半年开始量产。考虑到现在已经是2026年6月,这意味着首批芯片很可能已经在流片或小批量生产阶段。
博通在这里扮演的角色类似于"芯片设计服务商"。它不像英伟达那样卖成品芯片,而是帮助客户设计定制芯片,然后协调代工厂生产。Google的TPU、Meta的自研芯片,背后都有博通的身影。
对英伟达意味着什么?
短期来看,影响有限。
OpenAI不会因为有了Jalapeño就停止采购英伟达的GPU。训练大模型仍然需要通用GPU的算力,而且OpenAI的推理需求增长速度可能比自研芯片的产能爬坡更快。Altman自己也说了,希望"与芯片制造商保持良好关系,特别是在使用新一代Blackwell芯片方面"。
但长期来看,这是一个危险的信号。
英伟达的护城河有两层:一是硬件性能领先,二是CUDA生态锁定。硬件领先可以靠研发投入追赶,生态锁定才是真正的壁垒——开发者习惯了CUDA,迁移成本极高,所以即使有替代品也不愿意换。
但云厂商和大模型公司是不同的物种。
他们有足够的工程能力构建自己的软件栈,有足够的规模摊薄定制芯片的研发成本,有足够的动机摆脱单一供应商的依赖。Google证明了TPU可以支撑世界级的AI系统,现在OpenAI也要证明同样的事情。
如果OpenAI的自研芯片成功了,其他大模型公司会怎么想?
Anthropic、xAI、Mistral、DeepSeek……这些公司现在都在给英伟达打工。他们看到OpenAI的路径走通了,会不会动心?
芯片行业的逻辑是规模经济。设计成本是一次性的,产量越大,单片成本越低。如果更多公司开始自研推理芯片,博通这样的设计服务商会变得更有竞争力,台积电的产能会更多地流向定制ASIC,英伟达的市场份额会被一点点蚕食。
这不是明天的事,但可能是五年后的事。
OpenAI的芯片野心
回顾OpenAI在硬件层面的布局,你会发现这次合作不是心血来潮。
2024年初,就有消息称OpenAI在探索自研芯片,团队规模约20人,核心成员包括曾参与Google TPU项目的工程师。当时还传出OpenAI计划建立自己的芯片代工厂,但因为成本太高、周期太长而搁置。
转而与博通合作,是一个更务实的选择。OpenAI专注于芯片架构设计,把物理实现和制造交给专业的合作伙伴,这样可以更快地把产品推向市场。
从战略角度看,OpenAI需要在三个层面建立竞争优势:
模型层:GPT系列的能力边界在哪里?能不能持续保持领先?
应用层:ChatGPT能不能守住用户心智?企业市场能不能打开?
基础设施层:算力成本能不能降下来?供应链能不能自主可控?
前两层是OpenAI一直在做的事情,第三层才刚刚开始。但基础设施往往是最容易被忽视、却最能决定长期胜负的因素。
想想看,如果OpenAI的推理成本比竞争对手低30%,它可以做什么?
- 在同样的定价下获得更高的利润率
- 或者降价抢市场,用价格战挤压对手
- 或者把省下的钱投入到更大规模的训练中,拉开模型能力的差距
这三个选项,每一个都是致命的。
10吉瓦的野心
回到那个数字:10吉瓦。
这个规模的算力部署,不是OpenAI一家能消化的。即使ChatGPT的用户量再翻几倍,即使API调用量指数增长,也用不了这么多。
一个合理的推测是,OpenAI在为更大的事情做准备。
可能是AGI。Altman一直说OpenAI的目标是"不惜一切代价构建通用人工智能"。AGI需要什么样的算力?没人知道,但肯定比现在多得多。
可能是AI代理。如果AI从"对话助手"进化成"自主代理",能够长时间持续运行、主动完成复杂任务,推理需求会呈几何级数增长。一个用户从每天问几个问题,变成让AI全天候帮自己工作,算力消耗可能增加几十倍。
可能是多模态。当模型需要同时处理文本、图像、音频、视频,计算量会比纯文本模型大得多。OpenAI的Sora已经展示了视频生成的能力,如果这项技术要大规模商用,推理成本是一个巨大的挑战。
无论是哪种可能,10吉瓦的算力储备都说明OpenAI在押注一个比现在大得多的未来。
行业会怎么变?
这次发布之后,AI芯片的竞争格局会更加复杂。
第一阵营:英伟达
仍然是无可争议的霸主,通用GPU+CUDA生态的组合短期内无人能撼动。但市场份额的天花板可能已经出现了。
第二阵营:云厂商自研
Google TPU、亚马逊Inferentia/Trainium、微软Maia,这些芯片主要用于自家云服务,不对外销售。优势是可以针对自己的工作负载深度优化,劣势是规模受限于自身业务。
第三阵营:模型公司自研
OpenAI的Jalapeño开了一个头。如果成功,会有更多模型公司跟进。这个阵营的特点是需求明确(就是跑自己的模型),但芯片设计经验相对不足,需要依赖博通这样的合作伙伴。
第四阵营:独立芯片公司
AMD、Intel、以及一众初创公司。AMD的MI300已经在追赶英伟达,Intel的Gaudi也在努力。初创公司里,Cerebras、Groq、SambaNova各有特色,但规模都还太小。
未来几年,我们可能会看到一个更加碎片化的市场。不同公司针对不同场景选择不同的芯片,不再是"英伟达通吃"的局面。这对整个行业来说是好事——竞争会推动创新,也会压低价格。
对开发者来说,这意味着更多的选择,但也意味着更高的学习成本。不同芯片有不同的软件栈,代码可能需要针对特定硬件优化。好消息是,主流框架(PyTorch、TensorFlow)正在努力抽象掉硬件差异,让开发者可以用统一的接口调用不同的后端。
写在最后
OpenAI造芯这件事,其实早就该发生了。
当一家公司的核心业务高度依赖某种稀缺资源,而这种资源被另一家公司垄断时,垂直整合就是必然的选择。这不是OpenAI的独创,是商业世界的基本逻辑。
苹果为什么要自研M系列芯片?因为不想被Intel卡脖子。特斯拉为什么要自研FSD芯片?因为Mobileye满足不了需求。现在OpenAI为什么要自研推理芯片?因为英伟达太贵、太缺货、太不可控。
这颗叫Jalapeño的芯片能不能成功,还需要时间验证。芯片行业的坑太多了,从设计到流片到量产到部署,每一步都可能出问题。但至少,OpenAI迈出了这一步。
对于开发者来说,短期内不会有什么直接影响。你调用的API还是那个API,模型还是那个模型。但从长远来看,如果OpenAI的自研芯片真的能降低推理成本,最终会反映在API价格上。
目前,OpenAI Hub已经支持GPT全系列模型的调用,包括最新的GPT-5.5。如果你在国内,通过聚合平台调用可能是更稳定的选择。
芯片的故事才刚刚开始。
参考来源
- OpenAI与博通推出LLM推理芯片"Jalapeño" - 知乎:详细介绍了合作的全系统方案,包括博通提供的端到端连接解决方案



