Codex 生图额度体系曝光:两套账本,一个坑

产品更新

社区开发者逆向发现,ChatGPT 的图片生成实际存在网页端和 Codex 两套独立额度体系,免费用户完全无法使用 Codex 生图,付费用户的 Codex 生图消耗量则是普通用量的 3-5 倍。

Codex 生图额度体系曝光:两套账本,一个坑

一句话:你以为的「一个额度」,其实是两个

近日,开发者社区 Linux.do 上一篇关于 GPT 账号 image2 额度的技术分析帖引发了广泛讨论。帖子作者通过抓包和接口分析,揭示了一个此前并未被 OpenAI 官方明确说明的事实——ChatGPT 的图片生成能力背后,实际运行着两套完全独立的额度计费体系。

这不是一个小细节。对于正在用 Codex 做开发辅助、同时又依赖 GPT 图像生成能力的开发者来说,这意味着你的用量消耗速度可能比你想象的快得多。

两条路径,两套规则

先说结论。GPT 的 image2(即当前最新的图像生成能力)有两种调用方式:

  • 网页对话生图:通过 /f/conversation 接口触发,也就是你在 ChatGPT 网页端或 App 里直接对话让它画图的那种方式。
  • Codex 工具调用生图:通过 /codex/responses 接口触发,这是 Codex 编程助手在执行任务过程中,自主决定调用图像生成工具时走的路径。

关键在于:这两条路径的额度是分开计算的,互不相通。

ChatGPT 网页生图与 Codex 生图的两条调用路径示意图,左侧为 /f/conversation 网页端,右侧为 /codex/responses 工具调用端,中间用虚线隔开表示额度独立

用一个不太精确但足够直观的类比:这就像你办了一张银行卡,以为线上线下共享一个额度,结果发现线上消费和线下刷卡各有各的限额,而且线下刷一笔顶线上三到五笔。

免费用户:Codex 生图?没你的份

帖子中最直接的发现之一是关于免费账户的限制:

GPT Free 账号具有网页生图额度,但不具有 Codex 生成图片额度。

这意味着什么?如果你是 ChatGPT 的免费用户,你可以在网页端让 GPT 帮你画图(当然有次数限制),但当你使用 Codex 功能时,即便 Codex 在执行任务过程中判断需要生成一张图片,这个请求也会因为没有额度而失败。

这个设计从商业角度完全可以理解——Codex 本身就是面向开发者的高级功能,OpenAI 显然不希望免费用户通过 Codex 的工具调用机制来「白嫖」图像生成能力。但问题在于,这个限制在官方文档中并没有被清晰地标注出来。很多免费用户在尝试使用 Codex 进行涉及图像的开发任务时,可能会遇到莫名其妙的失败,却不知道原因出在额度体系的分离上。

付费用户:能用,但代价不低

非免费账号(Plus、Pro、Team、Enterprise 等)同时拥有网页生图额度和 Codex 生图额度。听起来不错,但这里有一个容易被忽略的细节:

Codex 生图会计入 Codex 用量,消耗大约是普通 Codex 用量的 3 到 5 倍。

这个倍率值得仔细品味。Codex 的用量本身就不便宜。根据 OpenAI 官方的 Pricing 页面,Codex 的计费是按照任务复杂度和 token 消耗来计算的。而当 Codex 在执行过程中调用了图像生成工具,这一次调用的用量消耗直接翻了 3-5 倍。

举个具体场景:假设你让 Codex 帮你搭建一个前端页面,Codex 在过程中自动生成了几张占位图或 UI 示意图。你可能觉得这只是顺手的事,但实际上每张图都在以 3-5 倍的速率吞噬你的 Codex 额度。如果你的工作流中频繁涉及图像生成,Codex 的额度可能会以超出预期的速度耗尽。

这就引出了一个实际的开发策略问题:在使用 Codex 时,是否应该主动避免让它调用图像生成工具?

对于额度敏感的开发者来说,答案可能是肯定的。如果你的任务确实需要图像,不如把生图的部分拆出来,单独在网页端完成,用网页端的额度来承担这部分消耗,而不是让 Codex 在工具调用链路中自动触发。

技术细节:工具调用机制下的生图

从技术实现的角度看,Codex 生图的原理是「工具调用」(Tool Use / Function Calling)。这是当前大模型领域的一个核心能力范式——模型本身不直接执行某些操作,而是通过调用外部工具来完成。

在 Codex 的场景中,图像生成被封装为一个可调用的工具。当 Codex 在分析任务需求后判断需要生成图片时,它会发起一次工具调用请求,这个请求走的是 /codex/responses 接口,而不是网页端的 /f/conversation 接口。

这种架构设计本身是合理的。工具调用是 AI Agent 的核心能力之一,让 Codex 能够在编程任务中自主调用图像生成、代码执行、文件操作等工具,是构建真正有用的编程助手的必经之路。但问题在于计费的透明度——当一个工具调用的成本是普通操作的 3-5 倍时,用户有权在调用发生之前就知道这一点。

从接口层面来看,两种调用方式的差异可以简化理解为:

网页生图路径:
POST /f/conversation
→ 用户消息包含生图意图
→ 模型生成图片
→ 消耗网页生图额度

Codex 生图路径:
POST /codex/responses
→ Codex 执行任务过程中判断需要生图
→ 触发工具调用(tool_use)
→ 调用图像生成工具
→ 消耗 Codex 额度(3-5x 倍率)

两条路径最终调用的底层图像生成模型可能是同一个(大概率是 DALL·E 或其迭代版本),但计费入口完全不同。这种「同一能力、不同入口、不同价格」的模式,在云服务领域并不罕见,但通常会被更明确地标注出来。

这件事为什么重要

表面上看,这只是一个额度计费的技术细节。但往深了想,它反映了几个值得关注的趋势:

1. AI 产品的计费复杂度正在急剧上升

早期的 ChatGPT 计费很简单:免费用户有次数限制,Plus 用户按月付费享受更高额度。但随着 Codex、图像生成、语音、视频等多模态能力的叠加,计费体系正在变得越来越复杂。不同能力、不同调用路径、不同倍率,这些细节交织在一起,普通用户很难完全搞清楚自己的额度到底是怎么被消耗的。

这不是 OpenAI 一家的问题。Anthropic 的 Claude 在推出 Tool Use 能力后,也面临类似的计费透明度挑战。Google 的 Gemini 在 AI Studio 和 Vertex AI 之间同样存在不同的计费逻辑。但 OpenAI 作为行业标杆,它的计费设计会直接影响整个行业的定价范式。

2. Codex 正在从「编程助手」进化为「AI Agent」

Codex 能够自主调用图像生成工具,这本身就说明它已经不再是一个简单的代码补全工具。它正在向 AI Agent 的方向演进——能够理解任务目标、规划执行步骤、自主调用各种工具来完成复杂任务。

在这个演进过程中,工具调用的成本管理会成为一个越来越重要的话题。今天是图像生成 3-5 倍消耗,明天可能是代码执行、网络搜索、文件操作各有各的倍率。开发者需要开始建立「AI Agent 成本意识」,就像我们管理云服务器的资源消耗一样,精细化地管理 AI 工具的调用成本。

3. 社区逆向工程的价值

这次额度体系的细节是由社区开发者通过抓包分析发现的,而不是 OpenAI 官方主动披露的。这再次证明了开发者社区在 AI 产品透明度方面的重要作用。当官方文档不够详细时,社区的逆向工程和经验分享就成了填补信息差的关键渠道。

开发者应该怎么做

基于目前已知的信息,给出几个实操建议:

对于免费用户:

  • 不要指望通过 Codex 来生成图片,这条路走不通
  • 图像生成需求统一走网页端对话,在额度范围内使用
  • 如果你的开发任务强依赖图像生成,认真考虑是否需要升级到付费计划

对于付费用户:

  • 注意监控 Codex 的用量消耗,特别是涉及图像生成的任务
  • 考虑将生图任务从 Codex 工作流中拆分出来,用网页端额度来承担
  • 在 prompt 中明确告诉 Codex 不要自动生成图片(如果你不需要的话),避免不必要的额度消耗
  • 关注 OpenAI 官方的 Pricing 页面更新,额度规则可能会随时调整

对于 API 开发者:

  • 如果你在通过 API 构建应用,目前这个额度分离主要影响的是 ChatGPT 产品端用户,API 端的计费逻辑相对独立
  • 但要注意,随着 Responses API 和工具调用能力的普及,类似的分层计费模式可能会逐步延伸到 API 端
  • 通过 OpenAI Hub 等 API 聚合平台调用时,可以更方便地在不同模型之间切换和对比成本,找到最适合自己场景的方案

等等,还有一些未解的问题

这次社区的发现虽然揭示了额度体系的基本结构,但仍有一些问题没有明确答案:

  • 网页生图额度和 Codex 生图额度各自的具体数值是多少? 目前只知道它们是分开的,但具体上限并不清楚。
  • 3-5 倍的消耗倍率是固定的还是动态的? 是否会根据生成图片的复杂度、分辨率等因素浮动?
  • 不同付费等级(Plus vs Pro vs Team vs Enterprise)的 Codex 生图额度是否有差异? 这一点官方 Pricing 页面也没有给出足够细致的说明。
  • 未来 Codex 调用其他工具(如代码执行、网络搜索)是否也会有类似的倍率消耗? 如果是,那 Codex 的实际使用成本可能比表面看起来高得多。

这些问题的答案,可能需要等待 OpenAI 官方的进一步说明,或者社区开发者的持续挖掘。

写在最后

AI 产品的计费透明度,正在成为一个越来越重要的话题。当模型能力从单一的文本对话扩展到多模态、多工具、多路径的复杂体系时,用户有权清楚地知道自己的每一分钱花在了哪里。

这次 Codex 生图额度体系的曝光,本质上是一个信息不对称的问题。OpenAI 设计了一套精细的分层计费机制,但没有把规则讲清楚。社区开发者通过技术手段填补了这个信息差,这是好事。但更好的做法,应该是官方主动把这些细节写进文档里。

毕竟,开发者最讨厌的不是付费,而是付了费之后不知道钱是怎么没的。


参考来源