OpenAI 把 Codex 做成 CLI 了

产品更新

OpenAI 推出 Codex CLI 命令行工具,直接在终端调用 AI 写代码、审查、调试。还能通过插件接入 Claude Code 等编辑器,免费用户也能用。

OpenAI 把 Codex 做成 CLI 了

OpenAI 刚推出了 Codex CLI,一个能在命令行直接调 AI 写代码的工具。不用切编辑器,终端里敲几个命令就能让 AI 帮你写代码、审查、改 bug。更狠的是,它还做了插件系统,能直接塞进 Claude Code 这种竞品里用。

这事儿有点意思。Anthropic 的 Claude Code 和 Google 的 Gemini CLI 都在往「AI 原生开发环境」这个方向卷,OpenAI 这次没跟着做编辑器,而是把 Codex 拆成了一个独立的命令行工具——你用什么编辑器都行,我只负责提供 AI 能力。

装上就能用,ChatGPT 免费账号也行

安装很简单,npm 一行命令搞定:

npm install -g @openai/codex

装完之后需要登录,支持两种方式:ChatGPT 账号或者 OpenAI API Key。关键是 ChatGPT 免费用户也能用,用量算在 Codex 配额里。如果你已经在用 ChatGPT,基本不用额外配置。

codex login

登录后会在本地生成配置文件,存在 ~/.openai/config.json。如果你有多个项目需要切换不同的 API Key,可以手动编辑这个文件:

{
  "api_key": "sk-xxxxxxxxxxxx",
  "model": "gpt-4",
  "temperature": 0.7,
  "max_tokens": 2048
}

记得 chmod 600 保护一下,别让 API Key 泄露。

对于国内开发者来说,直连 OpenAI API 可能会遇到网络问题。这时候可以用 OpenAI Hub 这类聚合平台,一个 Key 调所有模型,国内直连,兼容 OpenAI 格式。配置方式一样,只需要把 api_key 换成 OpenAI Hub 的 Key,base_url 指向 https://api.openai-hub.com/v1 就行。

Codex CLI 安装和配置流程截图

核心功能:写代码、审查、调试

Codex CLI 的核心能力集中在三个方向:

1. 代码生成和重构

直接在终端里描述需求,Codex 会生成符合项目风格的代码。不是那种孤立的代码片段,而是能理解你的项目结构、依赖关系、命名规范的完整实现。

比如你在一个 Express 项目里,想加一个用户认证的中间件:

codex generate "add JWT authentication middleware for Express"

Codex 会分析你的项目结构,看你用的是什么数据库、有没有现成的 user model,然后生成一个完整的中间件文件,包括 token 验证、错误处理、类型定义。

对于大型重构任务,Codex 能处理跨文件的修改。比如你要把一个 REST API 改成 GraphQL,它会自动识别所有相关的 controller、service、model,生成对应的 resolver 和 schema。

2. 代码审查

codex review 是个很实用的功能。默认审查当前未提交的修改,也可以指定分支或 commit 范围:

# 审查当前修改
codex review

# 审查整个分支
codex review --base main

# 多文件改动,后台运行
codex review --base main --background

审查内容包括潜在 bug、边界条件遗漏、性能瓶颈、安全风险。思科在实际应用中,代码审核速度提升了 50%。

更狠的是 adversarial-review,专门挑毛病。它会质疑你的设计选择,追问竞态条件,挑战你的回滚方案:

codex adversarial-review --background "look for race conditions"

这个模式适合在 PR 提交前自查,比人工 review 更严格。

3. 自动化调试

codex rescue 能读取错误堆栈,定位问题代码,生成修复方案。不是简单的 Google 搜索,而是结合你的项目上下文给出可执行的 patch。

codex rescue --error "TypeError: Cannot read property 'id' of undefined"

Codex 会分析调用链,找到所有可能导致 undefined 的地方,然后生成带防御性检查的修复代码。

插件系统:直接塞进 Claude Code

OpenAI 这次做了个很聪明的决定——不自己做编辑器,而是做插件系统。现在 Codex CLI 可以直接接入 Claude Code、Cursor、VS Code 这些主流编辑器。

以 Claude Code 为例,三条命令搞定:

/plugin marketplace add openai/codex-plugin-cc
/plugin install codex@openai-codex
/reload-plugins

然后运行 /codex:setup,它会自动检测你本地有没有装 Codex CLI。没装的话会提示你安装,或者你可以手动 npm install -g @openai/codex

重点是,这个插件不会另外装一套 Codex。它直接调用你电脑上已有的 Codex CLI,配置和登录状态全部共用。没登录的话,在 Claude Code 里输入 !codex login 就行。

装完之后,Claude Code 会多出一组命令:

  • /codex:review:让 Codex 帮你过一遍代码,只看不改
  • /codex:adversarial-review:故意挑毛病
  • /codex:rescue:直接把活儿甩给 Codex,写代码、调试 bug
  • /codex:status:查看后台任务进度
  • /codex:result:查看执行结果

这个设计很巧妙。Anthropic 做 Claude Code 是想把开发者锁在自己的生态里,OpenAI 反其道而行之,让 Codex 成为一个「能力层」,你用什么编辑器都行。这样一来,开发者不用在「用 Claude 还是用 Codex」之间二选一,而是可以同时用——Claude Code 负责编辑器体验,Codex 负责 AI 能力。

Codex CLI 在 Claude Code 中的插件界面

实际应用场景

从目前的案例来看,Codex CLI 在几个场景下特别有用:

遗留系统维护

对于那些没文档、没注释、原作者已经跑路的老项目,Codex 能读取整个代码仓库,自动分析架构设计、业务逻辑、模块依赖,生成详细的代码解释。这对接手陌生项目的开发者来说是刚需。

大规模重构

Duolingo、Vanta 这些公司在用 Codex 做跨文件的重构任务。比如把一个 monorepo 拆成微服务,或者把 JavaScript 项目迁移到 TypeScript。Codex 能自动处理类型定义、import 路径、配置文件这些琐碎但容易出错的细节。

自动化测试

生成测试用例是个很费时间的活儿,尤其是边界条件和异常处理的测试。Codex 能根据函数签名和实现逻辑,自动生成覆盖率高的测试代码。

CI/CD 配置

配置 GitHub Actions、GitLab CI、Jenkins 这些工具需要熟悉 YAML 语法和各种插件。Codex 能根据项目类型(Node.js、Python、Go 等)生成标准的 CI/CD 配置,包括 lint、test、build、deploy 的完整流程。

和竞品比怎么样

现在 AI 编程工具主要有三个方向:

  1. 编辑器插件:GitHub Copilot、Cursor、Codeium,集成在编辑器里,实时补全代码
  2. AI 原生编辑器:Claude Code、Windsurf,从零设计的 AI 优先开发环境
  3. 命令行工具:Codex CLI、Gemini CLI,独立于编辑器的 AI 能力层

Codex CLI 的优势在于灵活性。你不用换编辑器,不用改工作流,装个 CLI 就能用。而且因为是命令行工具,可以很容易地集成到 CI/CD 流程里,做自动化审查、测试生成这些事情。

劣势是交互体验不如原生编辑器。Claude Code 可以在编辑器里直接显示 diff、高亮修改、一键应用,Codex CLI 只能输出文本或者生成 patch 文件,需要手动应用。

但 OpenAI 用插件系统补上了这个短板。现在 Codex CLI 可以接入 Claude Code、Cursor 这些编辑器,既保留了命令行的灵活性,又能享受图形界面的便利。

技术细节

Codex CLI 基于 Node.js 22+ 运行,底层调用 OpenAI API。支持的模型包括 GPT-4、GPT-4 Turbo、o1 系列。

对于代码生成任务,Codex 会先分析项目结构,提取关键信息(依赖、配置、代码风格),然后构造一个包含上下文的 prompt 发给模型。生成的代码会经过语法检查和格式化,确保能直接运行。

对于代码审查任务,Codex 会把代码转成 AST(抽象语法树),分析控制流、数据流、依赖关系,然后用模型识别潜在问题。这比简单的文本分析要准确得多。

对于调试任务,Codex 会解析错误堆栈,定位到具体的代码行,然后结合周围的上下文生成修复方案。如果是运行时错误,还会分析变量状态和调用链。

如果你想在自己的项目里集成 Codex 的能力,可以直接调 OpenAI API。这里给个 OpenAI Hub 兼容的示例:

import openai

# 配置 OpenAI Hub
openai.api_key = "your-openai-hub-key"
openai.api_base = "https://api.openai-hub.com/v1"

# 代码生成
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "system", "content": "You are an expert programmer."},
        {"role": "user", "content": "Write a Python function to validate email addresses using regex"}
    ],
    temperature=0.7,
    max_tokens=2048
)

code = response.choices[0].message.content
print(code)

OpenAI Hub 支持 GPT-4、Claude、Gemini、DeepSeek 等主流模型,国内直连,兼容 OpenAI 格式。如果你的项目需要调用多个模型做对比或 fallback,用聚合平台会方便很多。

值得关注的几个点

1. 免费用户也能用

ChatGPT 免费账号就能用 Codex CLI,用量算在 Codex 配额里。这对学生和个人开发者来说是个好消息。虽然配额有限,但日常写写小项目、审查代码够用了。

2. 插件生态

OpenAI 这次明确要做插件系统,不只是接入编辑器,还会支持 Jira、Linear、Notion 这些协作工具。想象一下,你在 Linear 上创建一个 issue,Codex 自动生成对应的代码和测试,然后提交 PR——这个流程已经不远了。

3. 企业版

思科、乐天这些大公司在用 Codex 做企业级开发。OpenAI 肯定会推企业版,提供私有部署、权限管理、审计日志这些功能。对于有合规要求的公司来说,这是刚需。

4. 和 GitHub Copilot 的关系

Codex 是 GitHub Copilot 的技术基础,但现在 OpenAI 把它做成了独立产品。这意味着 Copilot 可能会逐步迁移到 Codex CLI 的架构上,或者两者会有更深度的整合。

总结

Codex CLI 是个很务实的产品。它没有试图重新发明编辑器,而是把 AI 能力做成一个独立的命令行工具,让开发者在现有工作流里无缝接入。

对于已经在用 Claude Code 或 Cursor 的开发者,Codex CLI 提供了一个额外的选择——你可以继续用喜欢的编辑器,同时享受 OpenAI 模型的能力。

对于习惯命令行的开发者,Codex CLI 可以直接集成到脚本和 CI/CD 流程里,做自动化审查、测试生成、代码重构这些事情。

对于国内开发者,通过 OpenAI Hub 这类聚合平台可以解决网络问题,而且能同时调用 GPT、Claude、DeepSeek 等多个模型,灵活性更高。

现在 AI 编程工具的竞争已经从「谁的补全更准」进化到「谁的生态更开放」。OpenAI 这次选择做能力层而不是做闭环,是个聪明的策略。接下来就看插件生态能做到什么程度了。


参考来源