一句话讲清楚
OpenAI 给 Codex CLI 偷偷加了个新子命令:codex remote-control。官方 commit message 写得很克制——"Added codex remote-control as a simpler entrypoint for starting a headless, remotely controllable app-server."
翻译一下就是:以后你不用人坐在工作站前,也能让 Codex 干活了。手机、浏览器、甚至 Apple Watch,都能成为遥控器。
这个功能目前还没进官方公告,是社区在翻 Codex 仓库 commit 时挖出来的。linux.do 上已经有人开帖讨论,Reddit r/codex 几周前就在追这条线索——从最早 "remote control coming soon" 的 PR 痕迹,到现在 remote-control 子命令真正落地,节奏其实不慢。

这是补 Claude Code 的课
要理解这个更新的分量,得先看 Anthropic 那边发生了什么。
Claude Code 在去年底上线了 remote control:本地跑一个 Claude CLI 会话,手机 App 能直接接管——查看 diff、批准权限、发新指令、甚至语音输入。核心场景是"我在地铁上突然想到一个改动,掏出手机让 Agent 去跑,回到家代码已经写完在等我 review"。
这个范式一旦体验过就回不去了。编码 Agent 本来就是个长时间运行的异步任务,盯着终端看它打字纯属浪费人生。Claude Code 把交互从"同步终端"解耦成"异步审阅",是过去一年 AI 编码工具里少有的范式级改动。
Codex 之前一直没跟上。Codex CLI 强在跟 ChatGPT 账号体系打通、强在 GPT-5 系列模型的代码能力,但形态上还是死死绑在终端里。社区里抱怨过很多次:"为什么 Claude Code 能遥控,Codex 不行?"
现在,补上了。
remote-control 到底是个什么东西
从 commit 透露的信息和代码改动看,codex remote-control 本质上是启动一个 headless app-server——也就是不带 TUI 界面的 Codex 服务进程。
几个关键点:
- Headless:不占用终端,可以放在后台、放在远程机器、放在云沙箱里
- App-server:暴露一套可被外部调用的接口(推测是 WebSocket 或类似的长连接协议),用来接收指令、推送状态
- Remotely controllable:意味着有配套的客户端会跟它对话——大概率就是已经在路上的 Codex 桌面 App 和移动端
之前 Codex 仓库里就有过 app-server 相关的代码,但启动方式比较绕,需要搭参数。这次 remote-control 的定位是 "a simpler entrypoint"——把那些参数封装成一个开箱即用的命令。
大致用法应该是这样:
# 在你的开发机上启动一个可远程控制的 Codex 实例
codex remote-control
# 之后从手机 App / 浏览器连进来
# 同一个 ChatGPT 账号下自动配对
注意这里的拓扑:Codex 进程跑在你自己的机器上(能访问你的代码仓库、你的环境变量、你的 git),手机端只是个瘦客户端,负责显示和发指令。这跟"把代码上传到云端让 OpenAI 跑"是完全两回事,对企业用户友好得多——代码不出本地。
几个能想到的真实场景
这功能听起来花哨,但实际价值是什么?我想了几个开发者会真用上的场景:
场景一:长任务监督。让 Codex 跑一个大重构、迁移一个老模块,预计要四十分钟。以前你得守在电脑前批准它每一步的权限请求。现在去开会,手机上叮一声——它问你要不要执行 rm -rf node_modules,你点个允许,继续开会。
场景二:跨设备接力。早上在公司机器上让 Codex 开始干一个 feature,下班路上手机查看进度、追加要求;回到家用平板继续 review diff,最后在自己的台式机上 merge。整个会话状态一致。
场景三:云沙箱组合。Reddit 上有人提到,remote-control 配合云沙箱(cloud sandbox)使用——Codex 进程跑在云端隔离环境里,你从任何设备都能连过去操作。这对那些不想让 Agent 直接在本地搞破坏的人来说是刚需。
场景四:团队共享 Agent。一个 headless 的 Codex 服务理论上可以让多人接入(权限模型怎么设计另说)。一个值班 Agent,谁都能调度,这个想象空间不小。
跟 Claude Code 对比,差距在哪
说实话,Codex 这次是"追上",不是"超越"。Claude Code 的 remote control 已经迭代了几个月,踩过的坑不少:
- 移动端能不能跑
/clear这类斜杠命令(早期版本不行,社区抱怨过) - 能不能从手机停止 Agent、查看上下文使用量(也是一开始缺的)
- 通知系统怎么设计,权限批准的延迟体验
这些都是 Codex 接下来要面对的工程细节。从命令命名(remote-control 这种朴素的英文短语)和"simpler entrypoint"的措辞看,OpenAI 这次走的是稳扎稳打路线,先把 server 端搞稳,客户端慢慢迭代。
另一个值得关注的差异是生态打通。Claude Code 的 remote control 严格绑在 Anthropic 自家 App。Codex 这边,因为 app-server 是相对开放的协议层,理论上社区可以做第三方客户端——已经有人在用 happy.engineering 的 Happy CLI 工具做类似调度,未来可能出现专门为 Codex remote-control 优化的第三方面板。
一些还没揭晓的问题
现在能确认的信息止于 commit。几个关键问题还要等正式发布才知道答案:
- 认证模型:手机端怎么和本地 server 配对?走 ChatGPT 账号 OAuth?还是生成一次性 token?
- 网络穿透:如果开发机在公司内网、手机在外面,怎么连?需不需要中继服务?(Claude Code 是走 Anthropic 自己的中继)
- 离线降级:server 断线后会话状态保留多久?
- 多 session 管理:能不能同时挂着五个 Codex 实例分别干不同的活?
这些问题的答案直接决定了 remote-control 是"玩具"还是"生产力工具"。
写在最后
AI 编码 Agent 这一年的演进路径越来越清晰:从"在 IDE 里 tab 补全",到"在终端里跟你聊天写代码",再到现在"在后台异步干活,你只负责审阅"。每一步都是把人从循环里往外拨。
codex remote-control 这个 commit 看起来不起眼,但它代表 Codex 正式踏进第三阶段。等正式发布、等手机端 App 上线,开发者的工作流会再次被改写一次。
顺带一提,OpenAI Hub 已经支持 GPT-5 系列模型的 API 调用,国内直连兼容 OpenAI 格式,跑 Codex CLI 的开发者切个 base_url 就能用上。等 remote-control 正式 GA,我们再补一篇上手实测。
参考来源
- linux.do:codex 支持 remote control 了? — 国内社区最早注意到这条 commit 的讨论帖
- Reddit r/codex:Remote Control Coming Soon to Codex — 从仓库 commit 推测功能形态的早期讨论
- Reddit r/codex:Codex Desktop App 远程开发功能 — 桌面端配套功能的爆料
- Reddit r/codex:Codex Remote Control? — 关于手机/浏览器/Apple Watch 多端控制场景的讨论
- Reddit r/ClaudeAI:New in Claude Code Remote Control — 对标产品 Claude Code remote control 的功能与槽点
- Reddit r/codex:Codex 有没有调度模式? — 社区对 dispatch / remote 功能的现状梳理