GPT-5.6 抓包实锤:1.5M 上下文,下月上线

距 GPT-5.5 发布刚满三周,代号 iris-alpha 的 GPT-5.6 已经在 Codex 后台被开发者抓包,1.5M tokens 上下文跑通,前端审美质变。Polymarket 给出 6 月底前发布概率 85%。
GPT-5.5 才发布三周,GPT-5.6 的影子就已经出现在 OpenAI 自家的调用日志里。
过去几天,多名嗅觉灵敏的开发者在 Codex 后台日志里翻出了一个本不该出现的条目:gpt-5.6,内部代号 iris-alpha(鸢尾花)。一开始大家以为这只是金丝雀测试留下的脏数据——毕竟一周前你强行在代码里指定调用 gpt-5.6,系统还会冷冰冰丢出一个 model is not supported。但现在,通过 ChatGPT Pro 的 OAuth 通道,已经有人在 Codex 环境里把这个尚未公布的模型实际跑通了。
这不是空穴来风的小道消息。爆料人 Leo 直接放话:GPT-5.6 的首批 checkpoint 已经进入内部测试,预计 7 月正式发布。Polymarket 上「6 月 30 日前发布」的合约价格被推到了 85% 以上。

1.5M 上下文,把自己上一代拉爆了 43%
泄露信息里最硬的一条是上下文窗口。
探针测试显示,GPT-5.6 的上下文上限达到了 1.5M tokens。作为对比:
- GPT-5.5 API:1.05M tokens
- GPT-5.5 通过 Codex OAuth 通道:被限制在 400K
- GPT-5.6:1.5M tokens,直接拉升 43%
开发者在 OpenCode 里做了极限实测:输入塞到 90 万 tokens,模型回答依然连贯,跨过 1.05M 这条原本的天花板继续往里灌,请求依然能被接住。这意味着什么?意味着你可以一次性把一个中等规模的代码仓库——比如几十万行的微服务——整个塞进 prompt,让模型在完整上下文里做重构、做依赖追踪、做跨文件 bug 定位。
这在以前是不可想象的。GPT-5.5 的 1.05M 已经足够覆盖大部分单一项目,但企业级 monorepo 仍然要靠 RAG 切片。1.5M 让"塞整个 repo"这件事在中等项目里第一次成为默认选项,而不是需要架构设计的工程难题。
更关键的是模型自己暴露的细节:在测试对话里,新模型自报家门——运行在 openai/gpt-5.6,推理等级最高可设为 xhigh,并且支持极其迅捷的 fast 模式。这套配置基本延续了 5.5 时代的"思考预算可调"思路,但 xhigh 这个新档位是第一次出现,外加 fast 模式的存在,说明 OpenAI 在推理速度上又做了一轮明显的工程优化。
如果届时上线,OpenAI Hub 这边也会第一时间把 gpt-5.6 接入到聚合接口里,老规矩,OpenAI 兼容格式,一个 Key 切走:
from openai import OpenAI
client = OpenAI(
api_key=\"your-openai-hub-key\",
base_url=\"https://api.openai-hub.com/v1\"
)
resp = client.chat.completions.create(
model=\"gpt-5.6\",
messages=[
{\"role\": \"system\", \"content\": \"You are a senior frontend engineer.\"},
{\"role\": \"user\", \"content\": \"用极简风格做一个笔记应用的首页,淡紫色调,不要 AI 味。\"}
],
reasoning_effort=\"xhigh\", # 新增档位
max_tokens=8192
)
print(resp.choices[0].message.content)
注意那个 reasoning_effort=\"xhigh\" 参数——这是 5.6 比 5.5 多出来的档位。如果只是常规问答,老老实实用 medium 或者 fast,别浪费推理预算。
「去 Slop 化」:AI 终于开始懂审美了
如果说 1.5M 是 GPT-5.6 的外功,那真正让前端开发者破防的,是它在 UI 生成上的质变。
长期以来 AI 生成代码有个心照不宣的痛点:后端逻辑写得漂亮,一到前端就翻车。臃肿的 CSS、毫无设计感的高饱和度配色、千篇一律的卡片网格——业内管这叫 Slop(泥浆代码)。Claude 4.5 之所以靠 Artifacts 封神,很大程度上就是因为它的前端审美在同行里独一档。
而这次泄露中最让人意外的,是一个叫 Lumen Notes 的极简笔记应用。开发者没给任何详细的 UI 引导 prompt,只是让 GPT-5.6 默认生成,结果出来的东西具备这几个特征:
- 克制的色彩:放弃高饱和度,主色调用淡紫,关键组件用色彩编码标签做区分
- 字重分层:字体大小和粗细的层级关系清晰,导航直观到不需要说明书
- 没有 AI 味:没有那种一眼能看穿的「ChatGPT 网格」公式化布局

爆料人 Leo 自己都感慨,10 天前他还在公开吐槽 GPT-5.6 的前端效果极差,一周时间内变化天翻地覆。这不像是常规迭代能做到的,更像是 OpenAI 专门针对 UI de-slopification(去泥浆化)做了一轮定向数据训练。
这件事的意义大于一个 demo。它意味着前端从"AI 写代码 + 人调样式"的协作模式,可能要进入"AI 直接交付商业级 UI"的阶段。Claude Artifacts 的护城河——审美——第一次被 OpenAI 正面追平。
三个代号、双版本策略
泄露中还出现了三个内部测试代号:
iris-alpha(鸢尾花)ember-alpha(余烬)beacon-alpha(灯塔)
按惯例,这三个 alpha 应该分别对应不同尺寸或不同方向的 checkpoint——比如标准版、推理增强版、Agent 专用版。结合此前 OpenAI 的发布节奏,这次大概率走「双版本」策略:GPT-5.6 标准版 + GPT-5.6 Pro。Pro 版本预计会强化超长任务下的稳定性和多步推理。
业内一位资深人士的评价值得玩味:「版本号本身不重要,重要的是 OpenAI 已经把它当日常调试工具在内部用。当构建 AI 的工程师们都开始信任它做实际研发,说明能力确实上来了。」
这话不夸张。Codex 团队自己内部跑 5.6 调试 5.7 的训练流程,这种「自食其狗粮」是模型可用性的最硬信号。
迭代节奏:从三年一更,到 40 天一版
如果把 OpenAI 最近的发布节奏列出来,会发现一件细思极恐的事:
| 版本 | 发布日期 | 距上版间隔 | |------|----------|------------| | GPT-5.1 | 2025-11-12 | 97 天 | | GPT-5.3-Codex | 2026-02-05 | 56 天 | | GPT-5.5 | 2026-05-中 | ~45 天 | | GPT-5.6 | 预计 2026-07 初 | ~40 天 |
从 GPT-3 到 GPT-4 等了将近三年,从 GPT-4 到 GPT-5 等了一年多,而现在小版本的迭代周期已经压缩到 40 天量级。这个频率已经不是传统意义上的模型版本,更像是把 RLHF + 后训练 + 工具链优化打包成滚动发布。
背后的逻辑很清楚:Agent 工作流时代,benchmark 分数不再是唯一指标,工具调用稳定性、长任务持久性、UI 交付质量 这些「最后一公里」的东西必须靠高频迭代去打磨。一年发一次根本来不及。
六月战场:Anthropic 和 Google 也在憋大招
GPT-5.6 不是唯一一颗即将引爆的雷。
- Anthropic Claude Sonnet 4.8,代号
Conway,已经在 Vertex AI 后端列表里出现,主打持久化后台代理,明显是冲着企业级超长任务来的。同时还有传闻中的 Claude Mythos 1,在 Mythos Benchmark 上有泄露分数。 - Google Gemini 3.5 Pro 同样定档 6 月,意图在多模态领域扳回一城。
- 马斯克的 Grok 5 也在传闻档期内。
这意味着 6 月会成为 2026 年最密集的模型发布窗口。对开发者来说,这是好事——竞争压力让各家都不敢藏着掖着,benchmark 之外的真实体验提升肉眼可见。
但对应用层创业者来说,就要谨慎了。在这种迭代速度下,任何基于「当前模型能力上限」做的产品规划,都可能在 40 天后被一个新版本直接吞掉。Claude Artifacts 的审美护城河被追平只是开始。
一点判断
我个人觉得 GPT-5.6 这次最值得关注的不是 1.5M 上下文,也不是审美质变,而是 OpenAI 第一次在小版本号里塞进了「Pro」分级。
这意味着 OpenAI 正在把版本号变成产品线,而不是单纯的能力刻度。标准版面向开发者 API 和 ChatGPT,Pro 版可能定向给企业 Agent 场景。如果这个策略坐实,未来 GPT-5.7、5.8 大概率会延续这个分层逻辑,模型选型会变得更细——也更贵。
至于具体发布时间,按 Polymarket 当前赔率和 Leo 的口风,6 月底到 7 月初 是大概率窗口。Codex 团队自用已经稳定,剩下的就是公关节奏问题。
保持关注,下个月见真章。
参考来源
- GPT5.6 要来了?- linux.do:linux.do 社区关于 gptimage 调用 mini 模型推理、可能预示 5.6 即将到来的最早讨论帖
- GPT-5.6 泄露了 - 知乎专栏:新智元关于 GPT-5.6 内部代号、1.5M 上下文、Lumen Notes UI 的完整爆料整理



