AI 快讯GPT-5.6 下周登场:150 万上下文,OpenAI 准备掀价格战
产品更新

GPT-5.6 下周登场:150 万上下文,OpenAI 准备掀价格战

2026-06-20T09:06:08.032Z
GPT-5.6 下周登场:150 万上下文,OpenAI 准备掀价格战

OpenAI 内部代号 iris-alpha 的 GPT-5.6 系列预计 6 月 23 日发布,上下文窗口从 105 万拉到 150 万 tokens,智能体编码超过 Claude Mythos,且定价仅为对手的三分之一。

今天距离 OpenAI 那场没官宣但圈内人都心照不宣的发布会只剩三天。

根据 testingcatalog 昨天(6 月 19 日)的爆料,以及预测市场目前 78% 的押注概率,OpenAI 将在 6 月 23 日正式推出 GPT-5.6 系列,覆盖 mini、标准版和 Pro 三档。已有部分 ChatGPT Pro 订阅用户在 X 上贴出截图——他们的模型选择器里已经能看到 GPT-5.6 Pro 的入口。这事的节奏,和当年 GPT-4 Turbo 灰度的味道几乎一模一样。

但这次的看点不在版本号上抠的那个小数点,而在于 OpenAI 这一刀切得很狠:上下文窗口 150 万 tokens、智能体编码超 Claude Mythos、价格直接砍到对手的三分之一。三件事叠在一起,基本就是冲着 Anthropic 的脸去打的。

GPT-5.6 Pro 在 ChatGPT 模型选择器中曝光的截图

150 万 tokens:从「能塞下」到「真的能用」

先说上下文。GPT-5.5 的 API 上限是 105 万 tokens,通过 Codex OAuth 走的渠道更低,只有 40 万。GPT-5.6 直接把天花板抬到 1,500,000 tokens,幅度约 43%。

这个数字单独拎出来其实不算特别震撼——Gemini 2.0 当年就喊过 200 万,但实际超过 50 万之后注意力就明显衰减。GPT-5.6 让人在意的地方在于「真实可用区间」。开发者前阵子在 OpenCode 里做过极限压测,输入 90 万 tokens 时模型依然能稳定响应,跑到 105 万以上也没翻车。换句话说,这次不是用窗口大小做营销,是真的把长程注意力的衰减曲线压平了。

这个差别在工程上很关键。150 万 tokens 大概等于:

  • 一整个中型代码仓库的源文件(按 Python/TS 项目算,约 3-5 万行代码)
  • 一份 1,200 页的英文 PDF 合同 + 配套附件
  • 几十次往返的 agent 工作日志 + 工具调用历史

以前用 Claude 跑 agentic workflow,经常要在中途做 context compaction——把前面的对话压缩、摘要、丢掉冗余。这个动作本身是有信息损耗的,复杂任务跑到第十几步就开始「失忆」。GPT-5.6 如果真能在 90 万 tokens 区间保持精度,意味着 agent 可以一口气跑完一个完整的 sprint 周期,不需要中间存档。

编码能力:直接对标 Claude Mythos

Anthropic 在今年 4 月推的 Claude Mythos 系列,一直是开发者圈子里的智能体编码首选。Cursor、Cline、Aider 这几个主流工具的默认推荐基本都指向 Mythos Sonnet。GPT-5.6 的爆料里有一句话挺值得品:「在智能体编码工作中,GPT-5.6 已优于 Anthropic 的 Mythos 系列。」

这话是 OpenAI 自己放风还是开发者实测,目前没法 100% 确定,但有几条线索可以交叉验证:

第一,长周期编码任务的耗时。早期测试者反馈,同一个复杂项目用 GPT-5.6 Pro 跑下来要 20-40 分钟。这个时间不短,但关键是它跑完之后产出的东西「认知深度」明显比 GPT-5.5 高了一档——意思是模型不是在猛输出 token,而是会停下来思考、回头检查、修正方向。这恰恰是 Mythos 系列之前最强的地方。

第二,Codex 响应速度。这次 OpenAI 顺手把 Codex 那条管道也升级了。Codex 长期被诟病冷启动慢、流式输出卡顿,5.6 据说在底层做了批处理调度的优化。对于 IDE 插件、内联补全这种延迟敏感场景,这是个肉眼可见的改善。

第三,前端生成。有截图显示 GPT-5.6 在没有详细 prompt 的情况下,直接生成了一个叫 Lumen Notes 的极简记事应用。栅格布局、配色克制、字体层级清晰——重点是这玩意儿看起来「不像 AI 生成的」。过去模型出的前端要么过度堆砌,要么配色廉价,能直接拿来用的不多。如果这一代真的能稳定输出商用级 UI,那对一大批做 SaaS MVP 的小团队来说,设计师这个环节确实可以省了。

GPT-5.6 生成的 Lumen Notes 应用界面对比 GPT-5.5 的产出

价格战:OpenAI 这次是真打

爆料里最炸的其实是定价。原话是:「OpenAI 当前的 token 价格仅为 Anthropic 的一半左右,而 OpenAI 将直接发动价格战,在提升性能的前提下,进一步降价。」另一条来自预测市场的消息更激进——GPT-5.6 的 API 价格约为 Claude Fable 5 的三分之一

这个时机选得相当精准。Anthropic 6 月 9 日刚推 Claude Fable 5,6 月 12 日因为一个安全漏洞被美国商务部紧急下架,目前用户处在被迫迁移的过渡期。OpenAI 卡这个窗口出手,等于在对手补丁还没打完的时候直接降维打击。

从行业角度看,这是一个明显的信号:大模型的竞争已经从「秀肌肉」转向「抢市占」。过去两年大家比的是 benchmark、是参数规模、是发布会上 demo 的炸场程度。从今年开始,能力曲线在头部模型之间已经收敛到一个差不多的区间,真正决定胜负的变成了三个东西:单 token 成本、上下文吞吐、agentic 任务的完成率

GPT-5.6 这次基本是奔着这三件事去定义自己的。

怎么调:OpenAI Hub 已经准备好接入

GPT-5.6 一旦正式开放,OpenAI Hub(openai-hub.com)会跟首发同步上线接入,仍然是兼容 OpenAI 格式那一套,国内直连不用折腾代理。给一段最小示例,方便提前把脚手架准备好:

from openai import OpenAI

client = OpenAI(
    api_key="your-openai-hub-key",
    base_url="https://api.openai-hub.com/v1"
)

response = client.chat.completions.create(
    model="gpt-5.6-pro",
    messages=[
        {"role": "system", "content": "你是一个高级前端工程师。"},
        {"role": "user", "content": "用 Next.js 14 + Tailwind 写一个仿 Linear 的看板组件,要求支持拖拽和实时协作 hooks。"}
    ],
    max_tokens=8192,
    temperature=0.3
)

print(response.choices[0].message.content)

如果跑 agentic 长任务,建议把 max_tokens 拉大、temperature 压低到 0.1-0.2,配合流式输出处理超长 context 比较稳:

stream = client.chat.completions.create(
    model="gpt-5.6",
    messages=conversation,  # 可以塞 100w+ tokens 的历史
    stream=True,
    max_tokens=16384
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

用 OpenAI Hub 这边的好处是同一个 Key 可以来回切 GPT、Claude、Gemini、DeepSeek 做对比测试,不用注册一堆账号、维护一堆密钥。在 GPT-5.6 vs Mythos vs Gemini 3.5 Pro 的横评里,这种切换成本几乎可以忽略。

三档定位猜测:mini / 标准 / Pro 分别给谁用

爆料里说 GPT-5.6 会按惯例分三档,结合此前内部代号 iris-alpha、ember-alpha、beacon-alpha 来对应推测:

  • GPT-5.6 mini:大概率走低延迟、高并发场景,定位类似 GPT-4o-mini,单价应该会非常激进,瞄准的是把 Haiku 和 Gemini Flash 这一档打下来
  • GPT-5.6(标准版):日常对话、中等复杂度的代码任务、RAG 的主力。150 万 context 应该是这一档就给齐的
  • GPT-5.6 Pro:长思考、复杂 agent、研究级任务。耗时 20-40 分钟那个就是 Pro,本质上是把 reasoning budget 拉满

这个分档逻辑跟之前 o 系列的思路是延续的——把「快」「准」「深」三种需求拆开卖,让开发者按工作负载选合适的型号,而不是一刀切全用最贵的。

6 月这场硬仗

往大了看,2026 年 6 月这一波密集发布其实早有预兆。Anthropic 的 Claude Sonnet 4.8、Google 的 Gemini 3.5 Pro、xAI 的 Grok 5,加上现在的 GPT-5.6,四家旗舰都挤在同一个月。这不是巧合,是因为大家的训练 cycle 都对齐到了下一代 H200/B200 集群上线的节点。

但这场仗的有意思之处在于:没人再把发布会当成炫技舞台。Anthropic 的 Fable 5 因为安全问题翻车,Gemini 3.5 还在跟 NotebookLM 这种集成产品深度绑定走差异化,Grok 5 主打 X 平台的实时数据接入。OpenAI 这次选择最朴素也最致命的打法——把上下文做到最大,把价格压到最低,把编码能力做到最强

对开发者来说,这种打法其实是最实在的福利。性能上限抬高、价格下移,本来需要三家轮换调用降本的工作流,可能一个 GPT-5.6 mini 就能搞定。

不过有一点也得提一句:爆料毕竟是爆料,150 万 context、三分之一价格这些数字最终还得等 OpenAI 官方发布会上敲定。下周一(6 月 23 日)如果真按时发,OpenAI Hub 这边会第一时间同步接入并放出实测对比数据,建议蹲一下。

参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: