摩根大通预测智谱GLM-5.5八月发布参数或破1万亿

摩根大通最新研究报告预测，智谱将在2026年8月发布下一代旗舰模型GLM-5.5，参数规模有望突破1万亿，这将是智谱能力曲线能否继续上扬的关键一战。

摩根大通刚刚把智谱推上了风口浪尖。在最新一份覆盖中国AI公司的研究报告里，JPM明确给出了时间表和参数量级：GLM-5.5预计将在2026年8月发布，参数规模可能超过1万亿。原话是"This will be the next major test of Zhipu's ability to keep moving up the capability curve"——这是智谱能否继续沿能力曲线向上走的下一场大考。

这句话很有意思。投行分析师向来话不会说满，用"next major test"这种措辞，潜台词是：GLM-5和GLM-5.2确实把智谱推到了一个不错的位置，但要继续往上爬，1T参数级别的GLM-5.5必须打出来。如果打不出来，前面靠GLM-5那波涨上去的估值就要回吐。

智谱GLM系列模型迭代路线图

从GLM-5到GLM-5.5：智谱这半年到底跑了多快

要理解GLM-5.5为什么被押到这个高度，得先把时间线捋一遍。

2026年2月，智谱发布GLM-5技术报告，模型参数744B，训练token规模28.5T。这一代最核心的变化是把架构从标准MoE切到了DSA（DeepSeek Sparse Attention）稀疏注意力机制——根据token重要性动态分配注意力资源，长上下文能力不掉，但训练和推理成本砍下去一大截。

配合这套架构，智谱还重写了RL基础设施：在原来slime框架"训练-推理解耦"的基础上，进一步做到"生成-训练解耦"，把GPU利用率彻底榨干。再叠加新的异步Agent RL算法，让模型在长周期交互里持续学习。

结果是GLM-5在ArtificialAnalysis.ai、LMArena的文本和代码榜单上拿了开源SOTA，真实编程场景的体感被海外开发者评为"逼近Claude Opus 4.5"。这个评价在开源圈里是相当夸张的。

更值得注意的是商业化端的反馈。GLM Coding Plan上线即售罄，智谱不得不按Max→Pro→Lite的顺序灰度开放GLM-5。供不应求到什么程度？智谱直接涨价——中国区30%，海外版翻倍以上。这是国内大模型厂商第一次主动提价，过去两年大家都在比谁降得狠，智谱反向操作还卖断货，这件事本身就说明了模型的市场地位。

紧接着4月、5月又出了GLM-5.2，摩根大通在另一份报告里说，GLM-5.2"提升了能力及综合价格"，所以上调了对智谱AI的收入预测。注意这里的措辞是"综合价格"——能力提升的同时单位token价格也涨了，这在开源模型阵营里几乎是孤例。同期JPM把智谱目标价上调至1800港元，股价当天一度飙四成。

1T参数的意义：不只是数字游戏

那么GLM-5.5的1T+参数到底意味着什么？

首先要澄清一点，1T参数不是新鲜事。GPT-4传闻是1.8T MoE，Claude Opus也被估算在万亿级，DeepSeek V3.1是671B总参数。智谱真正要做的不是"做大"，而是在DSA架构下把规模和效率一起拉到新的平衡点。

从GLM-5的744B到GLM-5.5的1T+，参数量增长大概34%。但参数量不等于成本——稀疏注意力的核心价值就是把激活参数和总参数解耦。换句话说，GLM-5.5即使总参数过万亿，每个token实际激活的参数量很可能还在百亿量级。这意味着推理成本不会按比例上涨，但模型容量可以装下更复杂的能力分布。

这个路线和Kimi K2、DeepSeek-V3走的是同一条思路：用稀疏化换规模，用规模换上限。但智谱有一个比较独特的点是Agent专项强化学习。GLM-5那套异步Agent RL算法在长程交互场景里表现明显优于结果监督式训练，如果GLM-5.5沿着这条路再走一步，它在coding agent和工程化任务上的领先优势可能会进一步拉开。

GLM-5与同代主流大模型在编程基准上的对比

八月发布窗口：跟谁卡位

摩根大通选"八月"这个时间点不是随口一说。把同期友商的节奏摊开看就清楚了：

Kimi K3：业内普遍预期在2026年Q3发布，月之暗面这一代主打多模态推理
DeepSeek V4.1：技术圈预期窗口也在7-8月间，DeepSeek上一代V4在6月已经放出
Qwen 4代：阿里通义的下一代节奏据传也在Q3

也就是说，8月可能是2026年下半年开源模型最拥挤的发布窗口。智谱选择这个时间点出手，要解决的核心问题是：当一堆万亿级开源模型同时上桌，凭什么用户继续买GLM Coding Plan而不是切到别家？

JPM报告里把这点说得很直白——"短期内需关注GLM-5.2的需求韧性、同行如Kimi K3及DeepSeek V4.1的模型迭代进展"。这是分析师在帮你想清楚最坏情况：如果Kimi K3或DeepSeek V4.1先一步把SOTA抢走，GLM Coding Plan的提价策略会失效，订阅留存会出问题。

所以GLM-5.5不只是技术发布，更是一次商业化卡位。智谱押的是"我8月先上车，把企业级客户的预算锁掉"。

估值视角：港股AI第一股的下一站

智谱是港股市场上最纯粹的AI标的之一。从1月上市到现在5个月，股价累计涨幅一度超过500%。这种走势在港股科技板块里是罕见的，因为大部分时候港股AI概念股都跟着美股NVIDIA走，缺乏独立催化剂。智谱不一样——它有自己的产品节奏，每次模型发布都能形成独立的股价催化。

JPM这次的研究报告其实是在帮市场做预期管理：

短期：盯GLM-5.2的需求韧性，看Coding Plan的续费率
中期：8月GLM-5.5发布，参数破1T是基准线
长期：智谱要证明它能持续在能力曲线上跑赢中美一线玩家

这里有个细节值得说一下。GLM-5原生适配了七大国产GPU平台：华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯、燧原。这一手在GLM-5.5上大概率会继续保留甚至加深。在当下的地缘环境下，这是智谱区别于纯互联网系厂商的一个独特身位——它既是基础模型公司，也是国产算力生态最深度的合作方之一。万亿参数模型如果能在国产GPU上跑通推理，这件事本身的战略价值就远超模型本身。

开发者视角：值不值得等

回到开发者层面，GLM-5.5如果按预期落地，对几类用户的影响很不一样。

做Coding Agent的：这是受益最直接的一波。GLM-5在真实软件工程任务上的表现已经把开源天花板抬高了一截，GLM-5.5如果继续在异步Agent RL算法上加码，做IDE插件、做代码审查工具、做自动化PR的团队会有新的基线模型可用。Claude Sonnet系列虽然好，但API成本和访问限制是绕不开的坎，GLM-5.5的开源+国内直连组合在工程化落地上更友好。

做长上下文应用的：DSA架构在长上下文场景下的成本优势会被进一步放大。如果GLM-5.5把上下文窗口推到百万级以上同时保持稀疏注意力的效率，做RAG、做代码库分析、做文档处理的开发者基本可以不用再纠结成本。

做多模态的：这是目前GLM系列相对弱项。摩根大通的报告里没有提到GLM-5.5的多模态扩展，意味着这一代大概率还是以文本和代码为主战场。要做VLM应用的开发者可能还得继续观望Qwen-VL或者GPT-4o这边。

做C端应用的：智谱的提价策略表明它现在的优先级在企业市场。C端开发者短期可能感觉不到太多变化，但中长期看，如果GLM-5.5的推理成本能继续压低，价格下沉到一定阈值后，C端场景的可用性会有质变。

一个没人提但很关键的问题

最后说一个JPM报告里没明说的事：1T参数的开源模型，谁能本地跑？

答案是几乎没人能。这意味着GLM-5.5即使开源，绝大多数开发者要用它还得走API。这就把智谱的商业模式逻辑闭环了——开源是为了拿口碑、拿生态、拿企业私有化部署的大单子，API是为了赚个人开发者和中小企业的现金流。

GLM-5.5如果按这个剧本走通，会是国内开源大模型商业化的一个标志性样本。

顺便提一句，OpenAI Hub 目前已经支持 GLM 系列模型的统一调用，跟 GPT、Claude、Gemini、DeepSeek 走同一套 OpenAI 兼容接口，等 GLM-5.5 正式发布后会第一时间接入，想做多模型 A/B 测试的开发者可以少折腾一些适配工作。

8月还有不到两个月，到时候再看智谱这场大考考得怎么样。

参考来源

linux.do - 摩根大通预测八月份会上GLM-5.5：摩根大通研究报告原文截图与社区讨论，包含JPM对GLM-5.5参数规模和发布时间窗口的核心判断。

摩根大通押注：智谱GLM-5.5八月发布，参数或破万亿

从GLM-5到GLM-5.5：智谱这半年到底跑了多快

1T参数的意义：不只是数字游戏

八月发布窗口：跟谁卡位

估值视角：港股AI第一股的下一站

开发者视角：值不值得等

一个没人提但很关键的问题

参考来源

相关推荐

亿速云杀进Token套餐战局：GPT模型打包卖，编程套餐还送服务器

OpenAI 找 Getty 买图：ChatGPT 终于不用再"脑补"画面了

三星全员上 ChatGPT：OpenAI 拿下史上最大企业单

联系我们