GPT-5.6 抓包实锤：1.5M 上下文，iris-alpha 代号下月上线

距 GPT-5.5 发布刚满三周，代号 iris-alpha 的 GPT-5.6 已经在 Codex 后台被开发者抓包，1.5M tokens 上下文跑通，前端审美质变。Polymarket 给出 6 月底前发布概率 85%。

GPT-5.5 才发布三周，GPT-5.6 的影子就已经出现在 OpenAI 自家的调用日志里。

过去几天，多名嗅觉灵敏的开发者在 Codex 后台日志里翻出了一个本不该出现的条目：gpt-5.6，内部代号 iris-alpha（鸢尾花）。一开始大家以为这只是金丝雀测试留下的脏数据——毕竟一周前你强行在代码里指定调用 gpt-5.6，系统还会冷冰冰丢出一个 model is not supported。但现在，通过 ChatGPT Pro 的 OAuth 通道，已经有人在 Codex 环境里把这个尚未公布的模型实际跑通了。

这不是空穴来风的小道消息。爆料人 Leo 直接放话：GPT-5.6 的首批 checkpoint 已经进入内部测试，预计 7 月正式发布。Polymarket 上「6 月 30 日前发布」的合约价格被推到了 85% 以上。

GPT-5.6 在 Codex 后台日志中泄露的截图

1.5M 上下文，把自己上一代拉爆了 43%

泄露信息里最硬的一条是上下文窗口。

探针测试显示，GPT-5.6 的上下文上限达到了 1.5M tokens。作为对比：

GPT-5.5 API：1.05M tokens
GPT-5.5 通过 Codex OAuth 通道：被限制在 400K
GPT-5.6：1.5M tokens，直接拉升 43%

开发者在 OpenCode 里做了极限实测：输入塞到 90 万 tokens，模型回答依然连贯，跨过 1.05M 这条原本的天花板继续往里灌，请求依然能被接住。这意味着什么？意味着你可以一次性把一个中等规模的代码仓库——比如几十万行的微服务——整个塞进 prompt，让模型在完整上下文里做重构、做依赖追踪、做跨文件 bug 定位。

这在以前是不可想象的。GPT-5.5 的 1.05M 已经足够覆盖大部分单一项目，但企业级 monorepo 仍然要靠 RAG 切片。1.5M 让"塞整个 repo"这件事在中等项目里第一次成为默认选项，而不是需要架构设计的工程难题。

更关键的是模型自己暴露的细节：在测试对话里，新模型自报家门——运行在 openai/gpt-5.6，推理等级最高可设为 xhigh，并且支持极其迅捷的 fast 模式。这套配置基本延续了 5.5 时代的"思考预算可调"思路，但 xhigh 这个新档位是第一次出现，外加 fast 模式的存在，说明 OpenAI 在推理速度上又做了一轮明显的工程优化。

如果届时上线，OpenAI Hub 这边也会第一时间把 gpt-5.6 接入到聚合接口里，老规矩，OpenAI 兼容格式，一个 Key 切走：

from openai import OpenAI

client = OpenAI(
    api_key=\"your-openai-hub-key\",
    base_url=\"https://api.openai-hub.com/v1\"
)

resp = client.chat.completions.create(
    model=\"gpt-5.6\",
    messages=[
        {\"role\": \"system\", \"content\": \"You are a senior frontend engineer.\"},
        {\"role\": \"user\", \"content\": \"用极简风格做一个笔记应用的首页，淡紫色调，不要 AI 味。\"}
    ],
    reasoning_effort=\"xhigh\",  # 新增档位
    max_tokens=8192
)

print(resp.choices[0].message.content)

注意那个 reasoning_effort=\"xhigh\" 参数——这是 5.6 比 5.5 多出来的档位。如果只是常规问答，老老实实用 medium 或者 fast，别浪费推理预算。

「去 Slop 化」：AI 终于开始懂审美了

如果说 1.5M 是 GPT-5.6 的外功，那真正让前端开发者破防的，是它在 UI 生成上的质变。

长期以来 AI 生成代码有个心照不宣的痛点：后端逻辑写得漂亮，一到前端就翻车。臃肿的 CSS、毫无设计感的高饱和度配色、千篇一律的卡片网格——业内管这叫 Slop（泥浆代码）。Claude 4.5 之所以靠 Artifacts 封神，很大程度上就是因为它的前端审美在同行里独一档。

而这次泄露中最让人意外的，是一个叫 Lumen Notes 的极简笔记应用。开发者没给任何详细的 UI 引导 prompt，只是让 GPT-5.6 默认生成，结果出来的东西具备这几个特征：

克制的色彩：放弃高饱和度，主色调用淡紫，关键组件用色彩编码标签做区分
字重分层：字体大小和粗细的层级关系清晰，导航直观到不需要说明书
没有 AI 味：没有那种一眼能看穿的「ChatGPT 网格」公式化布局

GPT-5.6 默认生成的 Lumen Notes 应用界面

爆料人 Leo 自己都感慨，10 天前他还在公开吐槽 GPT-5.6 的前端效果极差，一周时间内变化天翻地覆。这不像是常规迭代能做到的，更像是 OpenAI 专门针对 UI de-slopification（去泥浆化）做了一轮定向数据训练。

这件事的意义大于一个 demo。它意味着前端从"AI 写代码 + 人调样式"的协作模式，可能要进入"AI 直接交付商业级 UI"的阶段。Claude Artifacts 的护城河——审美——第一次被 OpenAI 正面追平。

三个代号、双版本策略

泄露中还出现了三个内部测试代号：

iris-alpha（鸢尾花）
ember-alpha（余烬）
beacon-alpha（灯塔）

按惯例，这三个 alpha 应该分别对应不同尺寸或不同方向的 checkpoint——比如标准版、推理增强版、Agent 专用版。结合此前 OpenAI 的发布节奏，这次大概率走「双版本」策略：GPT-5.6 标准版 + GPT-5.6 Pro。Pro 版本预计会强化超长任务下的稳定性和多步推理。

业内一位资深人士的评价值得玩味：「版本号本身不重要，重要的是 OpenAI 已经把它当日常调试工具在内部用。当构建 AI 的工程师们都开始信任它做实际研发，说明能力确实上来了。」

这话不夸张。Codex 团队自己内部跑 5.6 调试 5.7 的训练流程，这种「自食其狗粮」是模型可用性的最硬信号。

迭代节奏：从三年一更，到 40 天一版

如果把 OpenAI 最近的发布节奏列出来，会发现一件细思极恐的事：

| 版本 | 发布日期 | 距上版间隔 | |------|----------|------------| | GPT-5.1 | 2025-11-12 | 97 天 | | GPT-5.3-Codex | 2026-02-05 | 56 天 | | GPT-5.5 | 2026-05-中 | ~45 天 | | GPT-5.6 | 预计 2026-07 初 | ~40 天 |

从 GPT-3 到 GPT-4 等了将近三年，从 GPT-4 到 GPT-5 等了一年多，而现在小版本的迭代周期已经压缩到 40 天量级。这个频率已经不是传统意义上的模型版本，更像是把 RLHF + 后训练 + 工具链优化打包成滚动发布。

背后的逻辑很清楚：Agent 工作流时代，benchmark 分数不再是唯一指标，工具调用稳定性、长任务持久性、UI 交付质量 这些「最后一公里」的东西必须靠高频迭代去打磨。一年发一次根本来不及。

六月战场：Anthropic 和 Google 也在憋大招

GPT-5.6 不是唯一一颗即将引爆的雷。

Anthropic Claude Sonnet 4.8，代号 Conway，已经在 Vertex AI 后端列表里出现，主打持久化后台代理，明显是冲着企业级超长任务来的。同时还有传闻中的 Claude Mythos 1，在 Mythos Benchmark 上有泄露分数。
Google Gemini 3.5 Pro 同样定档 6 月，意图在多模态领域扳回一城。
马斯克的 Grok 5 也在传闻档期内。

这意味着 6 月会成为 2026 年最密集的模型发布窗口。对开发者来说，这是好事——竞争压力让各家都不敢藏着掖着，benchmark 之外的真实体验提升肉眼可见。

但对应用层创业者来说，就要谨慎了。在这种迭代速度下，任何基于「当前模型能力上限」做的产品规划，都可能在 40 天后被一个新版本直接吞掉。Claude Artifacts 的审美护城河被追平只是开始。

一点判断

我个人觉得 GPT-5.6 这次最值得关注的不是 1.5M 上下文，也不是审美质变，而是 OpenAI 第一次在小版本号里塞进了「Pro」分级。

这意味着 OpenAI 正在把版本号变成产品线，而不是单纯的能力刻度。标准版面向开发者 API 和 ChatGPT，Pro 版可能定向给企业 Agent 场景。如果这个策略坐实，未来 GPT-5.7、5.8 大概率会延续这个分层逻辑，模型选型会变得更细——也更贵。

至于具体发布时间，按 Polymarket 当前赔率和 Leo 的口风，6 月底到 7 月初 是大概率窗口。Codex 团队自用已经稳定，剩下的就是公关节奏问题。

保持关注，下个月见真章。

参考来源

GPT5.6 要来了？- linux.do：linux.do 社区关于 gptimage 调用 mini 模型推理、可能预示 5.6 即将到来的最早讨论帖
GPT-5.6 泄露了 - 知乎专栏：新智元关于 GPT-5.6 内部代号、1.5M 上下文、Lumen Notes UI 的完整爆料整理

GPT-5.6 抓包实锤：1.5M 上下文，下月上线

1.5M 上下文，把自己上一代拉爆了 43%

「去 Slop 化」：AI 终于开始懂审美了

三个代号、双版本策略

迭代节奏：从三年一更，到 40 天一版

六月战场：Anthropic 和 Google 也在憋大招

一点判断

参考来源

相关推荐

英特尔砍掉BigDL：开源AI框架6月底归档

长安甩出"天枢领航"：把VLM塞进辅助驾驶，启源Q06九月上市

华为发了个 DevEco Code，把鸿蒙开发塞进了 Agent

联系我们