OpenAI 明晚直播:Codex 大更新与新推理模型在路上
OpenAI 把直播定在了 6 月 3 日,主题叫 Intelligence at Work。预告页面没说要发什么,但开发者圈子里已经开始押注:Codex 会迎来一次大版本跳跃,可能还会带一个新的推理模型一起出场。
这是 OpenAI 今年第三次以 Intelligence at Work 为名做直播。前两次分别带来了 GPT-5.3-Codex 和 GPT-5.4 Thinking 的家族成员,节奏稳得像在按月历翻页。按这个规律,明晚要么是 Codex 线再往前推一格,要么是推理线那边憋了个新东西。

一年下来,OpenAI 模型矩阵已经换了三轮
回头看 2026 年这半年的发布密度,能感觉到 OpenAI 在拼命换血。简单梳理一下时间线:
- 2 月 5 日:GPT-5.3-Codex 发布,编程速度比上一代提升约 25%,开始介入自身代码库的调试和部署
- 2 月 13 日:GPT-4o、GPT-4.1、GPT-4.1 mini、o4-mini 全线从 ChatGPT 下架
- 3 月 11 日:GPT-5.1 系列(Instant/Thinking/Pro)从 ChatGPT 退役,原有对话自动迁移到 5.3 Instant、5.4 Thinking、5.4 Pro
- 3 月 16 日:GPT-5.3 Instant 更新响应风格
- 3 月 18 日:GPT-5.4 mini 进入 ChatGPT,作为 5.4 Thinking 限流时的兜底
半年时间,主力被推到了 GPT-5.4 Thinking 这一档,Codex 线则停在 5.3。如果按 OpenAI 自己的节奏算,Codex 这边到了该动一动的时候。社区里之所以有人喊出 ChatGPT 5.6 的猜测,逻辑也在这:5.4 出了三个月,下一档要么是 5.5,要么直接跳。
为什么大家都盯着 Codex
Codex 不是新东西,但今年完全不一样了。
2 月 GPT-5.3-Codex 那次更新做了一件事,把 Codex 从单纯的代码补全模型,推到了一个能在真实工程环境里待住的智能体。最近几个月 Codex 又陆续接了一堆新口子:Mac 客户端上的本地代理、iOS/Android 的远程接管、Windows 上的 Computer Use 支持,能直接在 Windows 应用里看、点、敲。
这套打法的指向很明确:把 Codex 做成跨设备的开发协作终端,而不是一个对话框里的代码助手。你在 Windows 机器上让它跑测试,地铁上掏出手机继续指挥,到家打开 Mac 接着推进。文件、shell、本地服务都留在 Windows 那台主机上,移动端只是远程方向盘。
这个路径跟 Anthropic 的 Claude Code、Cursor 的 Background Agents 走的不是一条路。Cursor 是把 IDE 做厚,Claude Code 是把终端做活,而 Codex 在做的事情更像是把开发者本人变成调度中心,模型跑在哪、文件在哪、人在哪可以彻底解耦。
这就解释了为什么明晚这场直播被赋予了那么多期待。如果 Codex 要往前再走一步,要么是模型本身的代码能力再上一个台阶(更长上下文、更强的多文件重构、对 monorepo 的理解),要么是协议层的开放——比如把 Computer Use 的能力下放到第三方 IDE 和 CI 系统里。

推理模型那边也该动了
GPT-5.4 Thinking 是目前 ChatGPT 里默认的高强度推理模型,但它本质上还是 5.3 Thinking 的迭代版本,没有架构层面的更新。Pro 用户用得多了能感觉到几个老问题:
第一,思考时长不可控。虽然 2 月那次更新加了思考时长设置,但默认配置下遇到复杂问题还是会出现长时间空转,最后给出一个并不比快速回答好太多的结果。
第二,工具调用和推理是割裂的。当 Thinking 模式调用搜索或代码解释器时,推理链经常会被中断重启,不像 Anthropic 那边把 tool use 嵌入到 extended thinking 里那么自然。
第三,多模态推理短板。处理带图的数学题、电路图分析这类任务,5.4 Thinking 仍然是先把图片描述出来再推理,而不是真的在视觉空间里思考。
如果明晚发的是新一代 Thinking,这三个点至少得动一个,否则就只是常规 mini 升级。社区里流传的 ChatGPT 5.6 命名虽然听起来跳跃,但参考 OpenAI 内部一直把奇数版本号留给推理线的传统,5.5 给 Codex、5.6 给 Thinking 这个组合是有可能性的。
当然,OpenAI 也可能藏一手——重新启用 o 系列命名,发一个 o5 之类的纯推理模型,跟 GPT-5 系列形成双轨。这个猜测的依据是 Sam Altman 此前在播客里提过 "我们没有放弃 o 系列,只是在等一个值得叫 o5 的东西"。
对开发者意味着什么
抛开命名上的悬念,实质性的影响有几层。
API 价格大概率会调整。每次主版本更新 OpenAI 都会重新洗牌定价,5.3-Codex 当时的输入价比 5.1-Codex 降了大约 20%,输出基本持平。如果新 Codex 把上下文窗口从 400K 推到 1M,价格曲线会怎么走是个看点——是按比例涨,还是用 prompt caching 折扣对冲,决定了它在长代码库场景下能不能压过 Claude 的成本优势。
SDK 行为可能有 breaking change。Codex 系列从 5.2 开始就在悄悄改 streaming 协议,加了 reasoning_effort、tool_choice_strict 这类字段。新版本如果引入持久化会话或者把 Computer Use 标准化成一组 API,老代码迁移会有工作量。
ChatGPT 端的模型选择器又要变了。按惯例新模型上线后会有一波旧模型下架预告,5.3 Instant、5.4 mini 这些位置坐得稳不稳,明晚直播之后才好说。Plus 和 Pro 用户的额度怎么分配,也是要等官方公告。
OpenAI Hub 的同步节奏
按以往几次新模型发布的经验,OpenAI Hub 这边一般在官方 API 开放后几个小时内就能完成上架。今年 2 月 GPT-5.3-Codex 发布当晚,Hub 就把模型名同步到了 chat completions 接口,开发者不需要改代码、不需要换 SDK,把 model 字段换成新名字就能用。
如果明晚发布的是 Codex 新版本,调用方式照例是这样:
from openai import OpenAI
client = OpenAI(
api_key="your-openai-hub-key",
base_url="https://api.openai-hub.com/v1"
)
response = client.chat.completions.create(
model="gpt-5.5-codex", # 待官方确认的命名
messages=[
{"role": "system", "content": "You are a senior backend engineer."},
{"role": "user", "content": "重构这个 Python 服务,把同步 IO 改成 asyncio。"}
],
reasoning_effort="medium",
stream=True
)
for chunk in response:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
国内开发者关心的延迟问题,Hub 走的是直连线路,从国内访问首 token 通常在 800ms 以内,比走代理访问 OpenAI 官方端点稳定。一个 Key 同时能调 GPT、Claude、Gemini、DeepSeek,对要做模型对比测试的团队来说省事。
还要留意什么
直播时间是太平洋时间 6 月 3 日上午 10 点,对应北京时间 6 月 4 日凌晨 1 点。从 OpenAI 最近几次发布会的体感看,正片不会太长,30 分钟以内拿下,重头戏一般在最后 5 分钟的 one more thing。
几个值得关注的信号:
- 是否提及 Agents SDK 的更新。如果新 Codex 配合 Agents SDK 一起发,意味着 OpenAI 在给企业客户铺一条统一的 agent 部署路径
- 是否有定价幻灯片。OpenAI 直播一般不会专门讲价格,但如果出现了价格对比图,说明这次更新冲着 cost-performance 来
- Sam Altman 是否出镜。常规更新一般是产品负责人主讲,Altman 出镜的场次往往有更长期的战略宣告
如果明晚真的是 Codex 5.5 加新推理模型双线发布,OpenAI 在编程和推理两条赛道上都会重新拉开和对手的身位。如果只是常规 mini 升级,就当下半场提前预热——按节奏,7 月底前必有动作。
直播一开始,我们会第一时间跟进具体规格、价格和 API 字段变化。
参考来源
- OpenAI 明天直播,Codex 新东西要来了!ChatGPT 5.6? - linux.do 社区关于此次直播的讨论与猜测
- 全球 AI 模型发布时间线 - 知乎专栏整理的 OpenAI 与各家模型发布时间脉络