GPT-5.5 提前现身 Codex 控制台：灰度测试还是配置泄露？

多名开发者发现 Codex 控制台模型列表突然出现 GPT-5.5 及一批未知模型选项，疑似 OpenAI 正在进行灰度测试，GPT-5.5 或将成为整合编码、研究、记忆的统一超级模型。

Codex 控制台一夜之间多了一堆「不该出现」的模型

4 月 22 日凌晨，大量开发者打开 Codex 控制台时发现了异常——模型下拉列表里赫然多出了 GPT-5.5，以及一串谁也叫不上名字的新模型。消息在 Linux.do 论坛上迅速发酵，几个小时内至少冒出五六个同主题帖子，标题画风从「出 GPT-5.5 了？」到「不是哥们？我是吃菌子了吗？」，开发者们的困惑和兴奋溢于言表。

没有官方博客，没有发布会，没有 Sam Altman 的推文预热。GPT-5.5 就这么静悄悄地出现在了一个下拉菜单里。

Codex 控制台模型选择下拉列表截图，显示 GPT-5.5 及多个未知模型名称

到底发生了什么

综合多位开发者的反馈，情况大致如下：

在 Codex 控制台切换到「快速模式」后，模型列表中新增了 GPT-5.5 选项
同时出现的还有 GPT-5.4 Pro 等此前从未公开过的模型版本
一批完全陌生的模型名称也混在列表里，没有任何文档说明
有用户询问这些模型「你是谁」，得到的统一回答是：「我是 Codex，基于 GPT-5 的编码协作模型」
目前尚不清楚这一变化是面向所有用户还是仅限 Team 订阅账号，有免费用户声称也看到了选项

值得注意的是，有开发者实际试用后表示，这个所谓的「5.5」体感上「蠢蠢的，不像新模型」。这恰恰符合灰度测试的典型特征——模型端点可能已经部署，但背后跑的不一定是最终版本的权重，甚至可能只是一个路由占位符。

从 5.2 到 5.5：Codex 的迭代节奏比你想的快

要理解这次泄露的意义，得先回顾一下 Codex 最近半年的演进路径。

OpenAI 在去年底推出 Codex 桌面版时，内部代号就是「GPT-5.2-Codex」。那个版本主打的是 macOS 独立应用，支持多智能体并行编码，被外界视为对 Claude Code 的直接回应。当时 ChatGPT Plus 及以上用户拥有优先下载权，灰度范围不算大。

再往后，GPT-5.3 Codex 的出现带来了一个颇具里程碑意义的变化——OpenAI 在技术文档中明确写道：Codex 团队用 5.3 的早期版本来调试自身的训练过程、管理部署、诊断测试结果。换句话说，这是第一个「参与了自身创建过程」的模型。这个细节当时没有引起太大关注，但它暗示了 OpenAI 在 Codex 产品线上的野心远不止「写代码」这么简单。

现在，5.4 Pro 和 5.5 同时出现在控制台里。从 5.2 到 5.5，四个版本号在不到半年内迭代完成。这个节奏说明两件事：第一，Codex 已经成为 OpenAI 内部迭代最快的产品线之一；第二，版本号的密集跳跃意味着每个版本之间的差异可能并不像大版本升级那么剧烈，更像是持续调优和功能扩展。

GPT-5.5 可能是什么

虽然 OpenAI 没有任何官方说明，但结合已有信息和行业趋势，我们可以做一些合理推测。

从此前流出的产品规划来看，GPT-5.5 的核心战略指向一个「统一超级应用」的概念。具体来说，就是把 ChatGPT 的对话能力、Codex 的编码能力、Deep Research 的深度研究能力、以及 Memory 的长期记忆能力整合到一个统一的模型底座上。

这个方向其实不难理解。目前 OpenAI 的产品矩阵已经相当碎片化——你想写代码得用 Codex，想做深度调研得切到 Deep Research，想让 AI 记住你的偏好得依赖 Memory 功能。每个能力背后可能跑着不同的模型或模型变体。对开发者来说，这意味着你得在不同的 API 端点和模型名称之间来回切换，心智负担不小。

如果 GPT-5.5 真的是那个「统一底座」，它的意义就不仅仅是「更聪明的 GPT」，而是 OpenAI 产品架构的一次重大整合。一个模型，多种能力，按需调用。

当然，这只是推测。从目前灰度测试的表现来看，5.5 还远没到成熟的状态。

那些「不知名模型」又是什么

比 GPT-5.5 更让人困惑的，是同时出现在列表里的那一批完全陌生的模型。

多位开发者表示，这些模型的名称此前从未在任何 OpenAI 文档、博客或 API 参考中出现过。尝试与它们对话时，它们一律自称「基于 GPT-5 的 Codex」，没有提供任何区分信息。

这种情况有几种可能的解释：

第一种，这些是 OpenAI 内部的实验性模型变体，用于 A/B 测试不同的训练配置或推理策略。在大规模模型开发中，同时维护几十个实验分支是常规操作，只是通常不会暴露给外部用户。

第二种，这些模型对应的是不同的能力模块。比如一个专门优化了代码补全，一个专门优化了代码审查，一个专门优化了多文件重构。Codex 的多智能体架构本身就支持不同 agent 调用不同的底层模型。

第三种，纯粹是配置错误。某个内部环境的模型注册表被错误地同步到了生产环境。考虑到这些模型连基本的自我介绍都没有做区分，这种可能性其实不低。

不管是哪种情况，这次泄露都让外界窥见了 OpenAI 在 Codex 产品线上的投入规模——同时在测试的模型变体数量，远比公开可见的要多得多。

灰度测试还是配置事故？

这是社区里争论最激烈的问题。

支持「灰度测试」说法的人认为，OpenAI 近期的多次产品更新都采用了类似的渐进式发布策略。先在小范围用户中开放，收集反馈和性能数据，再决定是否全量推送。Codex 桌面版当初就是这么上线的。

但反对的声音也很明确：一个正经的灰度测试，不会连模型描述都没有，不会让一堆内部代号直接暴露在用户界面上，更不会让所有模型都返回同一句自我介绍。这更像是某个工程师合错了配置分支，把 staging 环境的模型列表推到了 production。

我个人倾向于认为，这是一次「半计划内」的事件。GPT-5.5 的灰度测试可能确实在计划中，但时间表被一次配置同步意外提前了。那些不知名的模型大概率不应该出现在用户面前。

从 OpenAI 的角度来看，这种泄露的影响其实有限。模型端点暴露了，但如果背后的权重还没有部署到位，用户拿到的也只是一个空壳。真正的能力验证，得等到 OpenAI 正式开放 API 访问之后才能进行。

对开发者意味着什么

如果你是一个正在用 Codex API 构建产品的开发者，这次事件有几个值得关注的信号。

首先，模型更新的节奏在加快。从 5.2 到 5.5，半年四个版本。这意味着你的代码里硬编码模型名称是一个越来越危险的做法。建议在架构层面做好模型版本的抽象，让切换模型变成一个配置项而不是代码改动。

其次，Codex 的能力边界在扩展。如果 5.5 真的整合了研究和记忆能力，那 Codex 就不再只是一个代码生成工具，而是一个具备上下文理解和长期记忆的编程协作伙伴。这对 AI 辅助开发产品的设计思路会有根本性的影响。

第三，多模型并存的局面会持续一段时间。即使 5.5 正式发布，5.3、5.4 大概率不会立刻下线。不同版本在不同任务上的表现差异，需要开发者自己去测试和评估。

对于想要第一时间体验新模型的开发者，可以关注一下 OpenAI Hub 这类 API 聚合平台。通常在 OpenAI 正式开放 API 后，这些平台会很快跟进支持，省去你自己折腾多个 API Key 和计费体系的麻烦。

竞争格局：Codex vs Claude Code

这次 GPT-5.5 的提前曝光，放在更大的竞争背景下看会更有意思。

就在上个月，Anthropic 的 Claude Code 刚刚经历了一次尴尬的源码泄露事件——全部源码被发现打包在 npm 发行版的 sourcemap 文件中，泄露规模达到 51.2 万行代码、44 个隐藏功能开关。这次事故虽然性质不同，但客观上让外界对 Claude Code 的工程管理水平产生了一些疑虑。

OpenAI 这边，Codex 桌面版主打的「多智能体并行」架构确实是一个差异化卖点。传统的 AI 编码助手是单线程的——你给它一个任务，它完成了再给下一个。Codex 的多智能体模式允许多个 agent 同时处理不同的子任务，比如一个在写新功能，一个在跑测试，一个在做代码审查。这种并行能力在大型项目中的效率提升是显著的。

如果 GPT-5.5 进一步强化了这种多智能体协作的底层能力，Codex 在 AI 编码工具的竞争中会拿到更多筹码。但话说回来，Claude Code 在代码理解和长上下文处理上的优势也很扎实，这场仗远没到分胜负的时候。

一个更大的问题

抛开具体的模型版本和产品功能，这次事件折射出的一个更深层的趋势是：AI 模型的发布正在变得越来越「软」。

过去，一个新模型的发布是一个明确的事件——有发布会、有技术报告、有基准测试分数、有 API 上线日期。现在，模型更新越来越像软件的持续部署：悄悄推上去，小范围测试，逐步放量，出了问题随时回滚。用户可能今天用的模型和昨天的已经不一样了，但他们完全不知道。

这种模式对 OpenAI 来说是合理的——降低发布风险，加快迭代速度。但对开发者来说，它带来了一个新的挑战：你构建产品所依赖的底层能力，可能在任何时候发生变化，而你甚至不会收到通知。

这也是为什么越来越多的开发者开始重视模型抽象层的建设。不要把你的产品绑死在某一个具体的模型版本上，而是建立一套能够快速切换、对比、回退的基础设施。这不是过度工程，而是在 AI 时代做产品的基本功。

接下来看什么

目前这个灰度（或者说泄露）还在持续中，OpenAI 官方尚未做出任何回应。接下来有几个关键节点值得关注：

OpenAI 是否会在近期发布 GPT-5.5 的正式公告
Codex 控制台的模型列表是否会被回滚，那些不知名模型是否会消失
已经拿到 5.5 访问权限的用户，能否跑出有意义的 benchmark 对比
API 层面是否会同步开放 GPT-5.5 的调用

如果你的 Codex 控制台里已经出现了这些新模型，建议截个图、跑几个测试用例，说不定过两天它们就消失了。在 AI 这个行业，「先到先得」有时候不是指产品，而是指情报。

参考来源

出 GPT-5.5 了？ — Linux.do 论坛讨论，多位用户确认 Codex 控制台出现 GPT-5.5 选项
Codex 上了一堆包括 5.5 在内的模型？其他不知名模型都是啥 — 关于未知模型身份的讨论，模型自称基于 GPT-5
GPT-5.5 上线了吗？为什么我的 Codex 出现这个模型了？灰度吗？ — 用户截图确认灰度测试现象
不是哥们？GPT5.5 可以在 Codex 里用了？ — 开发者实测反馈，包含对模型实际表现的初步评价
GPT-5.5 来了 — 最早发现异常的帖子之一

GPT-5.5 提前现身 Codex 控制台

Codex 控制台一夜之间多了一堆「不该出现」的模型

到底发生了什么

从 5.2 到 5.5：Codex 的迭代节奏比你想的快

GPT-5.5 可能是什么

那些「不知名模型」又是什么

灰度测试还是配置事故？

对开发者意味着什么

竞争格局：Codex vs Claude Code

一个更大的问题

接下来看什么

参考来源

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们