智谱 ZCode 3.0 押注自研 Agent,把第三方内核扫地出门

智谱今天发布 ZCode 3.0,正式切换到自研 ZCode Agent 内核,并深度适配 GLM-5.2。官方明确,后续不再维护第三方 Agent 适配——这是一次把开发体验主动权收回自己手里的动作。
智谱今天(6 月 13 日)扔出了一颗在国内编程工具圈不算小的石头:ZCode 3.0 正式发布,全面切换自研 ZCode Agent 内核,同时深度适配刚开放给 GLM Coding Plan 全量用户的 GLM-5.2。
这次更新最值得拎出来说的,其实不是那一长串功能 changelog,而是官方一句不太起眼的话——“后续版本将聚焦自研 Agent 体验,不再内置或维护其他 Agent 适配”。翻译一下:之前 ZCode 里那些挂着第三方 Agent 框架的兼容层,要被一刀切掉了。
这是一次相当强硬的产品收口。
为什么要把第三方 Agent 踢出去
过去一年,国产编程工具基本走的是“壳 + 第三方 Agent + 自家模型”的拼装路线。好处是冷启动快,坏处也很明显:模型再强,Agent 编排不是自家写的,长程任务一旦超过几十步,工具调用链就开始抽风,要么循环调用同一个工具,要么干脆漏掉关键步骤。开发者在 IDE 里改一个稍微复杂点的工程,经常是模型本身没问题,但 Agent 调度把它带沟里了。
智谱这次给出的判断很直接:针对满血 GLM 深度优化长程推理、工具调用和大型工程执行链路,整体任务完成效果已显著优于第三方 Agent。这话翻译成人话就是——我们自己写的调度器,比开源那几个跑得更稳,至少跑 GLM-5.2 是这样。
这个逻辑其实跟 Anthropic 之于 Claude Code、Cursor 之于自家 Agent 是一脉相承的:模型和 Agent 必须协同设计,工具调用的 prompt 模板、上下文截断策略、工具结果的回喂方式,都得跟着模型的偏好走。用通用框架去套一个特化模型,本质上是双输。

GLM-5.2:1M 上下文这次是“真能用”
伴随 ZCode 3.0 一起开放的是 GLM-5.2,智谱称其为“迄今能力最强的开源模型”,并且强调支持真正可用的 1M 上下文。
这里要划重点的是“真正可用”这四个字。1M 上下文窗口这件事,从 Gemini 1.5 开始已经成了标配宣传话术,但开发者都心知肚明:大多数模型在塞到 50 万 token 之后,召回率就开始断崖式下跌,所谓 needle-in-a-haystack 也只是“恰好戳中”。GLM-5.2 这次主打的就是把长程任务里的“记忆衰减”问题压下去——对于动辄几十个文件、上万行代码的真实工程,这是比 benchmark 跑分更刚的需求。
配合 ZCode Agent,GLM-5.2 跑一个跨文件重构、或者根据需求文档自动改造模块的链路,理论上能比之前在 GLM-5.1 + 第三方 Agent 上稳得多。当然这事得开发者上手实测,发布会数据看看就行。
值得一提的是,GLM-5.2 仍然是开源的。这条线智谱守得很稳——从 GLM-4.5 到 5.2,开源策略没断过。对企业开发者来说,这意味着你既可以用 GLM Coding Plan 订阅省事,也可以自己拉权重做私有部署。OpenAI Hub 这边也第一时间跟进了 GLM-5.2 的接入,国内开发者想在同一个 Key 里横向对比 Claude、GPT 和 GLM-5.2 的代码生成效果,省去了挨个开账号的麻烦。
ZCode 3.0 的七件事
抛开内核切换,3.0 这次的功能更新其实挺密集的,但有几个是真正解决日常痛点的,值得单独拎出来说。
分组式任务工作区
以前在 ZCode 里同时跑三四个 Agent 任务,标签页堆得像浏览器一样。3.0 引入了分组工作区,支持拖拽折叠、跨区迁移、批量管理。这个设计明显是奔着“多 Agent 并发”去的——当你让 Agent A 跑测试、Agent B 写文档、Agent C 修 bug 的时候,至少视觉上不会爆炸。
这个细节很 Cursor。或者说,国产编程工具终于开始正视“一个开发者会同时跑多个 Agent 任务”这个现实了。
Zread 智能项目知识库
这个功能有点意思。Zread 会自动给你的项目生成结构化文档,支持目录浏览、进度监测、一键重生成。本质上是把“让模型先读懂整个项目”这个前置动作沉淀成了可复用的知识库。
实际用下来最大的好处是减少了重复扫描的 token 消耗——以前每次开新会话,Agent 都得重新 grep 一遍项目结构,现在这层抽象固定下来了。对于大型 monorepo,这不是“锦上添花”而是“能不能用”的差别。
可视化 Git 分支图谱
直接在 IDE 里看分支拓扑、AI 自动生成提交注释。这个功能听起来朴素,但凡是带 AI 写 commit message 的,多半都有点用——毕竟没人爱写规范的 Conventional Commits。
其他几项
- 可定制聊天交互:流式渲染、思考过程展示、性能模式都可以开关,兼容低配设备。这点对老笔记本用户友好。
- 状态监控看板:聚合聊天摘要、任务进度、模型用量、上下文占用提醒。说白了就是让你随时知道“这次套餐还能撑多久”。
- 多类型附件:白板截图、文件路径、图片都能直接喂给 Agent,对前端开发者尤其友好——拖一张设计稿过去就能切图改样式。
- 全新视觉体系:深浅双主题,启动/登录/欢迎页面重构。这是 0.5 版本的常规操作,跳过。
这次更新意味着什么
往大了看,ZCode 3.0 是国产 AI 编程工具从“接入大模型”走向“模型与工具深度协同”的一个标志性节点。
国内之前的产品逻辑大多是“我有一个 IDE 插件,可以接各种模型”。这种打法的天花板很低——因为你永远不知道哪个模型会突然爆杀,你只能拼命做兼容层。但兼容层做得越厚,针对单个模型的优化空间就越小。
智谱这次反过来走:收窄兼容性,把所有工程力量压到 GLM 这一条线上。代价是失去了一部分“我想用 Claude/GPT 写代码”的用户,但换来的是 GLM 用户能用上一个真正为 GLM 调过的 Agent。
这是一个有点冒险的选择。但考虑到 GLM-5.2 的能力位次和 GLM Coding Plan 的订阅规模,智谱赌得起。
对开发者来说,更现实的问题是:如果你已经习惯了在编程工具里调多家模型横向对比,那 ZCode 3.0 之后你可能需要分场景使用——用 ZCode 跑 GLM 体系内的任务,用聚合平台调其他家做对照。OpenAI Hub 这类一个 Key 调所有模型的平台,恰好补上了这块需求空隙:在 ZCode 里享受深度适配的 GLM-5.2,在自己的脚本和工具里用同一套接口测 Claude、GPT、Gemini 的表现,互不打架。
一个开放问题
智谱这次的策略选择,其实也给国内同行抛出了一个问题:在模型迭代速度还远没到稳态的今天,是该做兼容多模型的“瑞士军刀”,还是该做绑定单模型的“专用电锯”?
ZCode 3.0 给出了它的答案。Cursor、Windsurf 那一批在硅谷的同行,也基本是这个答案。但国内市场的复杂之处在于,开发者对“模型选择自由”的需求格外强,单押一家的工具能不能跑出量,还得看下半年。
不管怎么说,3.0 这个版本号配上“切换内核 + 抛弃第三方 Agent”这个动作,分量是够的。剩下的就看 GLM-5.2 + ZCode Agent 在真实工程里能不能扛住考验了。
参考来源
- IT之家:智谱 AI 编程工具 ZCode 3.0 版本发布 —— ZCode 3.0 发布的一手信息,含完整 changelog



