摩根大通押注:智谱GLM-5.5八月发布,参数或破万亿

摩根大通最新研究报告预测,智谱将在2026年8月发布下一代旗舰模型GLM-5.5,参数规模有望突破1万亿,这将是智谱能力曲线能否继续上扬的关键一战。
摩根大通刚刚把智谱推上了风口浪尖。在最新一份覆盖中国AI公司的研究报告里,JPM明确给出了时间表和参数量级:GLM-5.5预计将在2026年8月发布,参数规模可能超过1万亿。原话是"This will be the next major test of Zhipu's ability to keep moving up the capability curve"——这是智谱能否继续沿能力曲线向上走的下一场大考。
这句话很有意思。投行分析师向来话不会说满,用"next major test"这种措辞,潜台词是:GLM-5和GLM-5.2确实把智谱推到了一个不错的位置,但要继续往上爬,1T参数级别的GLM-5.5必须打出来。如果打不出来,前面靠GLM-5那波涨上去的估值就要回吐。

从GLM-5到GLM-5.5:智谱这半年到底跑了多快
要理解GLM-5.5为什么被押到这个高度,得先把时间线捋一遍。
2026年2月,智谱发布GLM-5技术报告,模型参数744B,训练token规模28.5T。这一代最核心的变化是把架构从标准MoE切到了DSA(DeepSeek Sparse Attention)稀疏注意力机制——根据token重要性动态分配注意力资源,长上下文能力不掉,但训练和推理成本砍下去一大截。
配合这套架构,智谱还重写了RL基础设施:在原来slime框架"训练-推理解耦"的基础上,进一步做到"生成-训练解耦",把GPU利用率彻底榨干。再叠加新的异步Agent RL算法,让模型在长周期交互里持续学习。
结果是GLM-5在ArtificialAnalysis.ai、LMArena的文本和代码榜单上拿了开源SOTA,真实编程场景的体感被海外开发者评为"逼近Claude Opus 4.5"。这个评价在开源圈里是相当夸张的。
更值得注意的是商业化端的反馈。GLM Coding Plan上线即售罄,智谱不得不按Max→Pro→Lite的顺序灰度开放GLM-5。供不应求到什么程度?智谱直接涨价——中国区30%,海外版翻倍以上。这是国内大模型厂商第一次主动提价,过去两年大家都在比谁降得狠,智谱反向操作还卖断货,这件事本身就说明了模型的市场地位。
紧接着4月、5月又出了GLM-5.2,摩根大通在另一份报告里说,GLM-5.2"提升了能力及综合价格",所以上调了对智谱AI的收入预测。注意这里的措辞是"综合价格"——能力提升的同时单位token价格也涨了,这在开源模型阵营里几乎是孤例。同期JPM把智谱目标价上调至1800港元,股价当天一度飙四成。
1T参数的意义:不只是数字游戏
那么GLM-5.5的1T+参数到底意味着什么?
首先要澄清一点,1T参数不是新鲜事。GPT-4传闻是1.8T MoE,Claude Opus也被估算在万亿级,DeepSeek V3.1是671B总参数。智谱真正要做的不是"做大",而是在DSA架构下把规模和效率一起拉到新的平衡点。
从GLM-5的744B到GLM-5.5的1T+,参数量增长大概34%。但参数量不等于成本——稀疏注意力的核心价值就是把激活参数和总参数解耦。换句话说,GLM-5.5即使总参数过万亿,每个token实际激活的参数量很可能还在百亿量级。这意味着推理成本不会按比例上涨,但模型容量可以装下更复杂的能力分布。
这个路线和Kimi K2、DeepSeek-V3走的是同一条思路:用稀疏化换规模,用规模换上限。但智谱有一个比较独特的点是Agent专项强化学习。GLM-5那套异步Agent RL算法在长程交互场景里表现明显优于结果监督式训练,如果GLM-5.5沿着这条路再走一步,它在coding agent和工程化任务上的领先优势可能会进一步拉开。

八月发布窗口:跟谁卡位
摩根大通选"八月"这个时间点不是随口一说。把同期友商的节奏摊开看就清楚了:
- Kimi K3:业内普遍预期在2026年Q3发布,月之暗面这一代主打多模态推理
- DeepSeek V4.1:技术圈预期窗口也在7-8月间,DeepSeek上一代V4在6月已经放出
- Qwen 4代:阿里通义的下一代节奏据传也在Q3
也就是说,8月可能是2026年下半年开源模型最拥挤的发布窗口。智谱选择这个时间点出手,要解决的核心问题是:当一堆万亿级开源模型同时上桌,凭什么用户继续买GLM Coding Plan而不是切到别家?
JPM报告里把这点说得很直白——"短期内需关注GLM-5.2的需求韧性、同行如Kimi K3及DeepSeek V4.1的模型迭代进展"。这是分析师在帮你想清楚最坏情况:如果Kimi K3或DeepSeek V4.1先一步把SOTA抢走,GLM Coding Plan的提价策略会失效,订阅留存会出问题。
所以GLM-5.5不只是技术发布,更是一次商业化卡位。智谱押的是"我8月先上车,把企业级客户的预算锁掉"。
估值视角:港股AI第一股的下一站
智谱是港股市场上最纯粹的AI标的之一。从1月上市到现在5个月,股价累计涨幅一度超过500%。这种走势在港股科技板块里是罕见的,因为大部分时候港股AI概念股都跟着美股NVIDIA走,缺乏独立催化剂。智谱不一样——它有自己的产品节奏,每次模型发布都能形成独立的股价催化。
JPM这次的研究报告其实是在帮市场做预期管理:
- 短期:盯GLM-5.2的需求韧性,看Coding Plan的续费率
- 中期:8月GLM-5.5发布,参数破1T是基准线
- 长期:智谱要证明它能持续在能力曲线上跑赢中美一线玩家
这里有个细节值得说一下。GLM-5原生适配了七大国产GPU平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯、燧原。这一手在GLM-5.5上大概率会继续保留甚至加深。在当下的地缘环境下,这是智谱区别于纯互联网系厂商的一个独特身位——它既是基础模型公司,也是国产算力生态最深度的合作方之一。万亿参数模型如果能在国产GPU上跑通推理,这件事本身的战略价值就远超模型本身。
开发者视角:值不值得等
回到开发者层面,GLM-5.5如果按预期落地,对几类用户的影响很不一样。
做Coding Agent的:这是受益最直接的一波。GLM-5在真实软件工程任务上的表现已经把开源天花板抬高了一截,GLM-5.5如果继续在异步Agent RL算法上加码,做IDE插件、做代码审查工具、做自动化PR的团队会有新的基线模型可用。Claude Sonnet系列虽然好,但API成本和访问限制是绕不开的坎,GLM-5.5的开源+国内直连组合在工程化落地上更友好。
做长上下文应用的:DSA架构在长上下文场景下的成本优势会被进一步放大。如果GLM-5.5把上下文窗口推到百万级以上同时保持稀疏注意力的效率,做RAG、做代码库分析、做文档处理的开发者基本可以不用再纠结成本。
做多模态的:这是目前GLM系列相对弱项。摩根大通的报告里没有提到GLM-5.5的多模态扩展,意味着这一代大概率还是以文本和代码为主战场。要做VLM应用的开发者可能还得继续观望Qwen-VL或者GPT-4o这边。
做C端应用的:智谱的提价策略表明它现在的优先级在企业市场。C端开发者短期可能感觉不到太多变化,但中长期看,如果GLM-5.5的推理成本能继续压低,价格下沉到一定阈值后,C端场景的可用性会有质变。
一个没人提但很关键的问题
最后说一个JPM报告里没明说的事:1T参数的开源模型,谁能本地跑?
答案是几乎没人能。这意味着GLM-5.5即使开源,绝大多数开发者要用它还得走API。这就把智谱的商业模式逻辑闭环了——开源是为了拿口碑、拿生态、拿企业私有化部署的大单子,API是为了赚个人开发者和中小企业的现金流。
GLM-5.5如果按这个剧本走通,会是国内开源大模型商业化的一个标志性样本。
顺便提一句,OpenAI Hub 目前已经支持 GLM 系列模型的统一调用,跟 GPT、Claude、Gemini、DeepSeek 走同一套 OpenAI 兼容接口,等 GLM-5.5 正式发布后会第一时间接入,想做多模型 A/B 测试的开发者可以少折腾一些适配工作。
8月还有不到两个月,到时候再看智谱这场大考考得怎么样。
参考来源
- linux.do - 摩根大通预测八月份会上GLM-5.5:摩根大通研究报告原文截图与社区讨论,包含JPM对GLM-5.5参数规模和发布时间窗口的核心判断。


