OpenAI与博通联合发布首款自研推理芯片Jalapeño，未来四年将部署10吉瓦算力。这不只是一颗芯片，而是OpenAI摆脱英伟达依赖、掌控AI基础设施命脉的关键一步。

OpenAI亲自下场造芯，英伟达该紧张了

6月24日，OpenAI和博通（Broadcom）联合发布了一颗芯片。

名字很有意思——Jalapeño，墨西哥辣椒。辣不辣先不说，但这颗芯片的信号足够刺激：OpenAI终于有了自己的硅片。

这是一颗专门为大规模语言模型推理设计的AI加速器，是双方多代计算平台合作的第一款产品。根据《华尔街日报》披露的协议细节，两家公司将在未来四年内合作开发和部署10吉瓦的定制AI芯片和计算系统。

10吉瓦是什么概念？大约相当于10座大型核电站的输出功率。这不是在造芯片，这是在建发电厂级别的算力基础设施。

OpenAI与博通联合发布Jalapeño芯片的发布会现场或产品渲染图

为什么是现在？

答案很简单：钱和货。

Sam Altman 早就公开抱怨过两件事：英伟达GPU短缺，以及运行这些硬件的成本"令人眼花缭乱"。

这不是客套话。OpenAI是英伟达最大的客户之一，从2020年开始就在微软建造的超级计算机上训练模型，那台机器用了10000块英伟达GPU。到了GPT-4时代，这个数字翻了好几倍。而现在，随着GPT-5系列的迭代和ChatGPT用户量的爆炸式增长，推理侧的算力消耗已经远超训练。

这里需要区分两个概念：训练和推理。

训练是教模型学会能力，一次性投入巨大算力，完成后模型权重固定。推理是让模型干活，每次用户提问都要消耗算力，量级小但频次极高。对于ChatGPT这种日活过亿的产品，推理成本才是真正的无底洞。

英伟达的GPU是通用型选手，训练推理都能干，但"都能干"往往意味着"都不是最优解"。专门为推理设计的芯片，可以在特定工作负载下实现更高的能效比——同样的电费，跑更多的请求。

Google很早就想明白了这件事。TPU（Tensor Processing Unit）从2015年就开始研发，如今已经迭代到第五代，支撑着Google搜索、YouTube推荐和Gemini模型的推理需求。微软也在2023年发布了Maia 100，专门为Azure云上的AI推理优化。亚马逊有Inferentia和Trainium。Meta也在搞自己的芯片。

整个大厂圈子里，OpenAI是最后一个还在完全依赖外购芯片的玩家。

现在它补上了这一课。

Jalapeño到底是什么？

从目前公开的信息来看，Jalapeño是一颗ASIC（专用集成电路），不是GPU，也不是通用处理器。

它的设计目标非常明确：在大规模LLM推理场景下，提供比通用GPU更高的吞吐量和更低的单位成本。具体的架构细节还没有完全披露，但根据合作模式推测，这颗芯片大概率采用了以下技术路线：

1. 专为Transformer优化的计算单元

现代LLM几乎都是基于Transformer架构，核心运算是矩阵乘法和注意力计算。通用GPU为了兼容各种工作负载，设计上有很多"浪费"。专用ASIC可以把晶体管全部投入到Transformer最需要的运算上，砍掉不需要的功能模块。

2. 大容量高带宽显存

推理的瓶颈往往不是算力，而是显存带宽。模型越大，参数越多，每次推理需要从显存读取的数据量越大。Jalapeño大概率配备了大容量HBM（高带宽存储器），并针对LLM的访存模式做了优化。

3. 机架级系统集成

根据知乎上的信息，这次合作的范围"远不止一颗芯片"。博通提供了端到端的以太网、PCIe和光连接解决方案，是一个完整的机架级系统。这意味着OpenAI不只是在设计芯片，而是在设计整个数据中心的算力单元。

芯片本身再强，如果网络互联跟不上，大规模部署时就会遇到瓶颈。这种全栈式的合作模式，说明OpenAI在基础设施层面的野心不小。

4. 台积电代工

芯片设计是一回事，制造是另一回事。根据此前的报道，Jalapeño将由台积电代工，预计2026年下半年开始量产。考虑到现在已经是2026年6月，这意味着首批芯片很可能已经在流片或小批量生产阶段。

博通在这里扮演的角色类似于"芯片设计服务商"。它不像英伟达那样卖成品芯片，而是帮助客户设计定制芯片，然后协调代工厂生产。Google的TPU、Meta的自研芯片，背后都有博通的身影。

对英伟达意味着什么？

短期来看，影响有限。

OpenAI不会因为有了Jalapeño就停止采购英伟达的GPU。训练大模型仍然需要通用GPU的算力，而且OpenAI的推理需求增长速度可能比自研芯片的产能爬坡更快。Altman自己也说了，希望"与芯片制造商保持良好关系，特别是在使用新一代Blackwell芯片方面"。

但长期来看，这是一个危险的信号。

英伟达的护城河有两层：一是硬件性能领先，二是CUDA生态锁定。硬件领先可以靠研发投入追赶，生态锁定才是真正的壁垒——开发者习惯了CUDA，迁移成本极高，所以即使有替代品也不愿意换。

但云厂商和大模型公司是不同的物种。

他们有足够的工程能力构建自己的软件栈，有足够的规模摊薄定制芯片的研发成本，有足够的动机摆脱单一供应商的依赖。Google证明了TPU可以支撑世界级的AI系统，现在OpenAI也要证明同样的事情。

如果OpenAI的自研芯片成功了，其他大模型公司会怎么想？

Anthropic、xAI、Mistral、DeepSeek……这些公司现在都在给英伟达打工。他们看到OpenAI的路径走通了，会不会动心？

芯片行业的逻辑是规模经济。设计成本是一次性的，产量越大，单片成本越低。如果更多公司开始自研推理芯片，博通这样的设计服务商会变得更有竞争力，台积电的产能会更多地流向定制ASIC，英伟达的市场份额会被一点点蚕食。

这不是明天的事，但可能是五年后的事。

OpenAI的芯片野心

回顾OpenAI在硬件层面的布局，你会发现这次合作不是心血来潮。

2024年初，就有消息称OpenAI在探索自研芯片，团队规模约20人，核心成员包括曾参与Google TPU项目的工程师。当时还传出OpenAI计划建立自己的芯片代工厂，但因为成本太高、周期太长而搁置。

转而与博通合作，是一个更务实的选择。OpenAI专注于芯片架构设计，把物理实现和制造交给专业的合作伙伴，这样可以更快地把产品推向市场。

从战略角度看，OpenAI需要在三个层面建立竞争优势：

模型层：GPT系列的能力边界在哪里？能不能持续保持领先？

应用层：ChatGPT能不能守住用户心智？企业市场能不能打开？

基础设施层：算力成本能不能降下来？供应链能不能自主可控？

前两层是OpenAI一直在做的事情，第三层才刚刚开始。但基础设施往往是最容易被忽视、却最能决定长期胜负的因素。

想想看，如果OpenAI的推理成本比竞争对手低30%，它可以做什么？

在同样的定价下获得更高的利润率
或者降价抢市场，用价格战挤压对手
或者把省下的钱投入到更大规模的训练中，拉开模型能力的差距

这三个选项，每一个都是致命的。

10吉瓦的野心

回到那个数字：10吉瓦。

这个规模的算力部署，不是OpenAI一家能消化的。即使ChatGPT的用户量再翻几倍，即使API调用量指数增长，也用不了这么多。

一个合理的推测是，OpenAI在为更大的事情做准备。

可能是AGI。Altman一直说OpenAI的目标是"不惜一切代价构建通用人工智能"。AGI需要什么样的算力？没人知道，但肯定比现在多得多。

可能是AI代理。如果AI从"对话助手"进化成"自主代理"，能够长时间持续运行、主动完成复杂任务，推理需求会呈几何级数增长。一个用户从每天问几个问题，变成让AI全天候帮自己工作，算力消耗可能增加几十倍。

可能是多模态。当模型需要同时处理文本、图像、音频、视频，计算量会比纯文本模型大得多。OpenAI的Sora已经展示了视频生成的能力，如果这项技术要大规模商用，推理成本是一个巨大的挑战。

无论是哪种可能，10吉瓦的算力储备都说明OpenAI在押注一个比现在大得多的未来。

行业会怎么变？

这次发布之后，AI芯片的竞争格局会更加复杂。

第一阵营：英伟达

仍然是无可争议的霸主，通用GPU+CUDA生态的组合短期内无人能撼动。但市场份额的天花板可能已经出现了。

第二阵营：云厂商自研

Google TPU、亚马逊Inferentia/Trainium、微软Maia，这些芯片主要用于自家云服务，不对外销售。优势是可以针对自己的工作负载深度优化，劣势是规模受限于自身业务。

第三阵营：模型公司自研

OpenAI的Jalapeño开了一个头。如果成功，会有更多模型公司跟进。这个阵营的特点是需求明确（就是跑自己的模型），但芯片设计经验相对不足，需要依赖博通这样的合作伙伴。

第四阵营：独立芯片公司

AMD、Intel、以及一众初创公司。AMD的MI300已经在追赶英伟达，Intel的Gaudi也在努力。初创公司里，Cerebras、Groq、SambaNova各有特色，但规模都还太小。

未来几年，我们可能会看到一个更加碎片化的市场。不同公司针对不同场景选择不同的芯片，不再是"英伟达通吃"的局面。这对整个行业来说是好事——竞争会推动创新，也会压低价格。

对开发者来说，这意味着更多的选择，但也意味着更高的学习成本。不同芯片有不同的软件栈，代码可能需要针对特定硬件优化。好消息是，主流框架（PyTorch、TensorFlow）正在努力抽象掉硬件差异，让开发者可以用统一的接口调用不同的后端。

写在最后

OpenAI造芯这件事，其实早就该发生了。

当一家公司的核心业务高度依赖某种稀缺资源，而这种资源被另一家公司垄断时，垂直整合就是必然的选择。这不是OpenAI的独创，是商业世界的基本逻辑。

苹果为什么要自研M系列芯片？因为不想被Intel卡脖子。特斯拉为什么要自研FSD芯片？因为Mobileye满足不了需求。现在OpenAI为什么要自研推理芯片？因为英伟达太贵、太缺货、太不可控。

这颗叫Jalapeño的芯片能不能成功，还需要时间验证。芯片行业的坑太多了，从设计到流片到量产到部署，每一步都可能出问题。但至少，OpenAI迈出了这一步。

对于开发者来说，短期内不会有什么直接影响。你调用的API还是那个API，模型还是那个模型。但从长远来看，如果OpenAI的自研芯片真的能降低推理成本，最终会反映在API价格上。

目前，OpenAI Hub已经支持GPT全系列模型的调用，包括最新的GPT-5.5。如果你在国内，通过聚合平台调用可能是更稳定的选择。

芯片的故事才刚刚开始。

参考来源

OpenAI与博通推出LLM推理芯片"Jalapeño" - 知乎：详细介绍了合作的全系统方案，包括博通提供的端到端连接解决方案

OpenAI亲自下场造芯，英伟达该紧张了

OpenAI亲自下场造芯，英伟达该紧张了

为什么是现在？

Jalapeño到底是什么？

1. 专为Transformer优化的计算单元

2. 大容量高带宽显存

3. 机架级系统集成

4. 台积电代工

对英伟达意味着什么？

OpenAI的芯片野心

10吉瓦的野心

行业会怎么变？

写在最后

参考来源

相关推荐

谷歌把 Computer Use 塞进了 Gemini 3.5 Flash

Figma Config 2026：代码层与 AI 动效来了

NeMo AutoModel 发布：微调大模型终于不用转检查点了

联系我们