GPT-5.3-Codex 全面上线:成本跌破 1 毛/美元

产品更新

OpenAI 正式开放 GPT-5.3-Codex,定价低于 0.1 美元/百万 token,Free 用户可直接使用。这是继 Claude Opus 4.6 后又一次编程能力的正面交锋。

GPT-5.3-Codex 全面上线:成本跌破 1 毛/美元

OpenAI 在 4 月中旬悄然完成了 GPT-5.3-Codex 的全面部署。这个专为代码生成优化的模型,定价直接打到了每百万 token 不到 0.1 美元,比主力模型便宜一个数量级。更关键的是,Free 账户也能直接调用,不再需要 Plus 订阅。

这是 OpenAI 在编程垂直领域的一次明确表态。就在上个月 Claude Opus 4.6 发布时,Anthropic 强调了代码理解和多文件重构能力,现在 OpenAI 用价格和开放度回应:你能做的,我也能做,而且更便宜、门槛更低。

GPT-5.3-Codex 定价对比图

定价逻辑:用成本换规模

GPT-5.3-Codex 的定价策略很直接——通过极低的单次调用成本,吸引开发者把它嵌入到日常工作流。

按照社区实测数据,Codex 的输入成本约为 $0.08/1M tokens,输出成本 $0.24/1M tokens。对比 GPT-4 Turbo 的 $10/$30,这个价格几乎是「随便用」的水平。一个中等规模的代码补全请求(约 2000 tokens 输入 + 500 tokens 输出),成本不到 0.03 美分。

这种定价在 AI 模型里并不常见。通常新模型会先定高价,等成本降下来再调整。但 Codex 反其道而行之,直接用接近成本价的方式铺开。背后的逻辑可能是:

  1. 抢占 IDE 集成市场:GitHub Copilot、Cursor、Windsurf 这些工具都在争夺开发者的编辑器入口。Codex 的低价让第三方工具更容易接入,而不是被迫选择 Claude 或其他方案。

  2. 对冲 Claude 的企业渗透:Anthropic 最近在企业市场动作频繁,Opus 4.6 的长上下文和代码审查能力确实有吸引力。OpenAI 用 Codex 的价格优势,让中小团队和个人开发者先用起来,形成习惯。

  3. 为 GPT-5 铺路:Codex 可能是 GPT-5 架构的一个垂直切片。通过大规模部署收集真实场景的反馈,为主力模型的迭代提供数据。

Free 用户的「意外之喜」

更值得关注的是 Free 账户的开放。

根据 Linux.do 社区的反馈,部分 Free 用户在 4 月初曾短暂失去 Codex 访问权限,但在更新 CPA(可能是 Content Policy Agreement 或某种账户状态)后恢复。这说明 OpenAI 在逐步放开限制,而不是一刀切地只给付费用户。

这个策略很聪明。Free 用户通常是学生、独立开发者或者还在评估阶段的潜在客户。让他们免费用上 Codex,一方面降低了试用门槛,另一方面也在培养用户习惯。等他们需要更高的速率限制或企业级支持时,自然会转向付费方案。

对比来看,Claude 的 Free 层级虽然也能用 Sonnet 3.5,但 Opus 4.6 仍然是 Pro 专属。OpenAI 这次在开放度上占了上风。

实际表现:不只是「便宜」

Codex 的能力定位很明确:代码生成、补全、解释和简单重构。它不是用来替代 GPT-4 做复杂推理的,而是专门优化了编程场景的响应速度和准确性。

从社区反馈看,Codex 在以下场景表现不错:

  • 函数级代码生成:给定函数签名和注释,生成实现。准确率和 Copilot 接近,但响应更快。
  • 代码解释和注释:把一段复杂逻辑翻译成自然语言,或者反过来给代码加注释。
  • 单元测试生成:根据函数实现自动生成测试用例,覆盖常见边界条件。
  • 简单重构:变量重命名、提取函数、格式化等机械性工作。

但它也有明显短板:

  • 多文件理解能力弱:如果需要跨文件分析依赖关系或重构架构,Codex 会力不从心。这是 Claude Opus 4.6 的强项。
  • 上下文窗口较小:虽然官方没公布具体数字,但实测大约在 16K tokens 左右,处理大型代码库时需要手动切分。
  • 推理深度有限:遇到需要多步推理的算法问题(比如动态规划、图算法),Codex 的表现不如 GPT-4 或 o1。

换句话说,Codex 是个「快枪手」,适合高频、低复杂度的编程任务。如果你需要一个「架构师」来做系统级分析,还是得上 GPT-4 或 Claude Opus。

Codex 与其他模型能力对比雷达图

接入方式:API 和第三方工具

Codex 目前有两种主要接入方式:

1. 官方 API

OpenAI 的 API 已经支持 gpt-5.3-codex 模型标识。调用方式和其他模型一致:

import openai

openai.api_key = "your-api-key"

response = openai.ChatCompletion.create(
    model="gpt-5.3-codex",
    messages=[
        {"role": "system", "content": "You are a helpful coding assistant."},
        {"role": "user", "content": "Write a Python function to calculate Fibonacci numbers using memoization."}
    ],
    temperature=0.2,
    max_tokens=500
)

print(response.choices[0].message.content)

如果你在用 OpenAI Hub,可以直接用同样的代码,只需要把 api_keyapi_base 换成 Hub 的配置:

import openai

openai.api_key = "your-openai-hub-key"
openai.api_base = "https://api.openai-hub.com/v1"

response = openai.ChatCompletion.create(
    model="gpt-5.3-codex",
    messages=[
        {"role": "user", "content": "Explain this code: def fib(n): return n if n < 2 else fib(n-1) + fib(n-2)"}
    ]
)

print(response.choices[0].message.content)

OpenAI Hub 的好处是国内直连,不用担心网络问题,而且一个 Key 可以调所有主流模型(包括 Claude、Gemini、DeepSeek 等),方便做模型对比和降级策略。

2. 第三方工具集成

目前已经有不少工具支持 Codex:

  • Cursor:在设置里选择 Codex 作为代码补全模型,响应速度比 GPT-4 快很多。
  • Continue.dev:开源的 IDE 插件,支持自定义模型配置,可以把 Codex 设为默认。
  • Poe:Quora 的 AI 聊天平台,已经上线了 gpt-5.3-codex-spark 变体。不过有用户反馈通过 sub2api 转发时会出现空回复,可能是配置问题。

如果你在用 Poe 的 Codex 遇到空回复,检查一下这几个点:

  1. 模型名称是否正确:Poe 上的标识是 gpt-5.3-codex-spark,不是 gpt-5.3-codex
  2. Token 限制:Poe 的免费层有速率限制,可能触发了静默失败。
  3. sub2api 配置:如果用的是第三方转发服务,确认 endpoint 和 headers 设置正确。

竞争格局:Codex vs Claude Opus 4.6

Codex 的发布时机很微妙——正好在 Claude Opus 4.6 上线一个月后。

Opus 4.6 的卖点是「理解复杂代码库」和「多文件重构」,适合企业级场景。Codex 则主打「快速补全」和「低成本」,更适合个人开发者和高频调用场景。

两者的定位其实有错位:

维度 GPT-5.3-Codex Claude Opus 4.6
定价 ~$0.08/1M tokens (输入) ~$15/1M tokens (输入)
上下文窗口 ~16K tokens 200K tokens
响应速度 快 (优化过延迟) 中等
多文件理解
代码补全 中等
适用场景 IDE 集成、快速补全 代码审查、架构重构

如果你是个人开发者,日常写代码需要频繁的补全和解释,Codex 是更好的选择。如果你在做企业级项目,需要分析几十个文件的依赖关系或者做大规模重构,Opus 4.6 更合适。

理想情况下,两者可以配合使用:用 Codex 做日常补全,遇到复杂问题时切换到 Opus 或 GPT-4。这也是为什么 OpenAI Hub 这类聚合平台越来越受欢迎——一个 Key 搞定所有模型,根据任务类型动态选择。

背后的技术猜测

OpenAI 没有公布 Codex 的技术细节,但从定价和表现可以推测一些东西:

  1. 可能是蒸馏模型:Codex 很可能是从 GPT-4 或 GPT-5 蒸馏出来的小模型,专门针对代码任务优化。这样可以在保持准确率的同时大幅降低推理成本。

  2. 推理优化:响应速度明显比 GPT-4 快,可能用了 speculative decoding 或其他推理加速技术。

  3. 训练数据偏向代码:从表现看,Codex 在代码生成上的准确率接近甚至超过 GPT-4,但在通用推理上明显弱一些。说明训练时大幅增加了代码数据的比例。

  4. 可能共享 GPT-5 架构:如果 Codex 确实是 GPT-5 的垂直切片,那它的发布也是在为主力模型做压力测试。OpenAI 可以通过 Codex 的大规模部署,收集真实场景的性能数据和边界 case。

对开发者的影响

Codex 的上线对开发者生态有几个直接影响:

1. IDE 插件会更便宜

之前很多 AI 编程工具(比如 Cursor、Tabnine)要么自己训练模型,要么调用 GPT-4,成本都不低。Codex 的低价让这些工具可以降低订阅费用,或者提供更慷慨的免费额度。

2. 个人开发者的门槛降低

Free 用户能直接用 Codex,意味着学生和独立开发者不用花钱就能体验 AI 辅助编程。这对培养下一代开发者的 AI 使用习惯很重要。

3. 企业需要重新评估成本

如果你的团队在用 GitHub Copilot 或其他按座位收费的工具,可以算一下直接调用 Codex API 是否更划算。对于高频使用的团队,API 调用的总成本可能比订阅费低。

4. 模型选择更灵活

有了 Codex 这个「便宜快速」的选项,开发者可以根据任务复杂度动态选择模型:

  • 简单补全 → Codex
  • 复杂重构 → Claude Opus 4.6
  • 算法推理 → GPT-4 或 o1
  • 超长上下文 → Gemini 1.5 Pro

这种「模型组合拳」的策略会越来越常见。

未来走向:专用模型会是趋势吗?

Codex 的发布可能预示着一个趋势:通用大模型 + 垂直专用模型 的组合会成为主流。

通用模型(GPT-4、Claude Opus)负责复杂推理和多任务处理,但成本高、速度慢。专用模型(Codex、Gemini Code Assist)针对特定场景优化,便宜快速但能力范围窄。

这种分层策略对用户和厂商都有好处:

  • 用户:可以根据需求选择性价比最高的模型,不用为简单任务付「通用模型税」。
  • 厂商:可以用专用模型覆盖更多场景,同时保持通用模型的高端定位和利润率。

OpenAI 之前已经有 gpt-3.5-turbo-instruct 这种针对特定任务优化的模型,Codex 是这个策略的延续。预计未来还会看到更多类似的垂直模型,比如专门做数据分析的、专门做文案的、专门做翻译的。

Anthropic 和 Google 应该也会跟进。Claude 已经有 Haiku(快速便宜)和 Opus(强大昂贵)的分层,下一步可能会推出代码专用版本。Google 的 Gemini Code Assist 也在朝这个方向走。

小结

GPT-5.3-Codex 的上线是 OpenAI 在编程垂直领域的一次明确押注。通过极低的定价和对 Free 用户的开放,它在短期内可能会快速占领 IDE 集成和个人开发者市场。

但它不是万能的。对于需要深度代码理解和多文件重构的场景,Claude Opus 4.6 仍然是更好的选择。理想的使用方式是把两者结合起来:日常用 Codex,复杂任务上 Opus。

对开发者来说,现在是个好时机。模型越来越多、越来越便宜,工具链也越来越成熟。关键是要理解每个模型的优劣势,根据实际需求做选择,而不是盲目追新。

OpenAI Hub 这类聚合平台在这个背景下会越来越有价值——一个 Key 调所有模型,根据任务类型自动选择或手动切换,既能控制成本,又能保证效果。


参考来源