OpenAI 在周二(6 月 2 日)一口气给 Codex 塞了一整套新能力,意图很明显:不只是想让它继续在工程师的终端里跑,而是要把这个智能体推到更多白领的桌面上。同时发布的还有一份内部报告,专门讲 Codex 在知识工作场景里的使用情况——说白了,这家公司开始正式认真做企业市场了。
从去年底 GPT-5.2-Codex 发布、再到今年 3 月 macOS 应用上线、4 月集成原生浏览器、5 月 Windows 版跟进,Codex 这条产品线在过去半年里几乎是按月迭代的节奏。这一次的更新更像是一个汇总性的阶段总结:能力上从「写代码的智能体」转向「用代码完成任务的智能体」,商业上则补齐了企业部署的最后一公里。

这次到底更新了什么
核心动作可以拆成三块来看。
第一块是 Codex Labs,OpenAI 把它定位成「把 Codex 扩展到全球企业」的承载形态。合作伙伴清单里出现的是 Accenture、PwC、Infosys 这三家——都是典型的全球咨询和系统集成大厂。这个组合很有意思:OpenAI 自己不擅长做企业级交付,但这些咨询公司每年要给世界 500 强写无数行代码、做无数次系统集成。把 Codex 塞进它们的交付流水线里,等于直接接入了财富 500 强的软件生命周期。
第二块是和 Dell 的合作,把 Codex 带到混合云和本地部署环境。这个动作针对的是金融、医疗、政府这类「数据不能出墙」的客户。Codex 将接入 Dell AI Data Platform,未来还会探索与 Dell AI Factory 的整合。简单理解:以前你要用 Codex,得把代码和上下文交给云端;现在它可以下沉到你自己的机房里,贴着你的代码库、文档、业务系统跑。对那些一听到「数据出域」就摇头的合规部门来说,这扇门终于打开了。
第三块才是产品本身的能力扩展,也是最值得开发者细看的部分:
- 后台代理可见性:管理员可以在没有用户在场的情况下,查看 Codex 在通用应用中的交互记录。这是个企业治理的必要补丁——你不可能让一个智能体在公司里到处跑,却完全不知道它在干嘛。
- Mac 应用支持通用应用控制:Codex 现在可以直接驱动那些没有 API 接口的桌面应用。这一点其实是过去半年所有 Agent 产品都在卷的方向,但 OpenAI 把它做进了原生应用而不是浏览器扩展,意味着可控性和稳定性会更好一些。
- 长时间任务自动化:Codex 可以执行最长 8 小时的后台任务,并在指定时间自动启动。这条路径其实和 3 月份发布的 Automation 功能一脉相承,但把执行窗口从分钟级拉到了小时级。
- 新版预览页面:用户可以直接看到 Codex 生成的网页效果,定位标注还能精准锚定到具体元素。这部分是 4 月份原生浏览器集成的延续。
- 图像模型升级到 gpt-image-1.5:生成更快、保真度更高。Codex 应用里那个
$imagegen命令的产出质量应该会有可感知的提升。
知识工作场景:这不是程序员的玩具了
OpenAI 这次同时发布的内部报告里有个关键判断:Codex 的用户已经溢出了开发者群体。
看 OpenAI 给出的几个典型用例就知道方向在哪——
- 在多个工具之间收集背景信息、准备报告
- 分流产品反馈意见
- 评估潜在销售线索、撰写跟进邮件
- 协调跨业务系统的工作流
这些场景和「写代码」基本没关系了,更像是把销售、市场、运营、PM 这些岗位的日常重复劳动包出去。Codex 团队产品负责人 Thibault Sottiaux 在采访里说得也很直白:「在我们公司内部,Codex 正在为每个人服务,逐步接入到所有应用程序中。」
这套逻辑其实和 OpenAI 5 月份成立的「Deployment Company」(OpenAI Deployment Company)是同一条线——后者就是专门帮企业把 AI 集成进现有业务的咨询/交付实体。再加上 Atlas 浏览器项目、Codex 桌面应用,三块拼图开始合上:网页端 Atlas、操作系统层 Codex、垂直业务层 Deployment Company,OpenAI 是想把企业 AI 这个市场从入口到交付端到端吃下来。
数据说话:周活破 400 万
几个值得记一下的数字:
- Codex 周活跃用户(WAU)已经突破 400 万开发者
- 自 GPT-5.2-Codex 去年 12 月中旬发布以来,整体使用量翻了一番
- 过去一个月有超过 100 万开发者在使用 Codex
400 万 WAU 是个什么概念?作为对比,GitHub Copilot 在 2025 年中披露的数字是 1500 万付费订阅用户。但 Copilot 已经卷了快五年,Codex 从重启到现在不过一年多。OpenAI 自己也承认,Codex 已经是「增长最快的企业产品之一」。
这个增速能解释为什么 Anthropic、Google 都在拼命追。Claude Code 在企业级控制和 Agent SDK 上更激进,Cursor 走纯编辑器路线,Cognition 的 Devin 主打全自动工程师——但从生态厚度看,Codex 现在的优势是它背靠 ChatGPT 那 8 亿月活用户池,订阅渠道、品牌认知、模型迭代都是现成的。
和友商比,Codex 现在站在哪里
几个比较关键的差异点:
| 维度 | Codex | Claude Code | Cursor |
|---|---|---|---|
| 形态 | 原生应用 + CLI + IDE 扩展 + 网页 | CLI + Agent SDK | 编辑器 |
| 长任务 | 最长 8 小时后台 | Skills + 长上下文 | 偏交互式 |
| 企业部署 | Codex Labs + Dell 本地化 | 企业控制台 | 较弱 |
| 知识工作扩展 | 强(白领场景) | 强(Skills) | 弱 |
| 浏览器 | 原生集成 | Computer Use | 无 |
Codex 的策略明显是「全面铺开」,从开发者一直延伸到非技术岗位。Claude Code 走的是「深耕开发者+企业控制」,Cursor 则继续守住「最好用的 AI 编辑器」这块阵地。对独立开发者来说,问题已经不是哪个模型更强,而是哪种工作面更贴合你的日常节奏。
一个值得注意的安全设计
这次更新里有个容易被忽略的细节:Codex 的「通用应用控制」是建立在原生沙盒之上的。Codex 应用和 CLI 共用同一套开源、可配置的系统级沙盒——默认情况下,智能体只能在自己的工作目录或分支里改文件,使用缓存的网页搜索,需要联网或更高权限时才会请求许可。
企业管理员可以为团队配置规则,允许特定命令在需要时自动以更高权限运行。配合这次新增的后台代理可见性,整个治理闭环开始成型:沙盒隔离 + 权限规则 + 审计可见性。这一套东西在 Dell 本地化部署的场景里尤其关键,因为本地部署的潜台词就是「数据极度敏感,权限必须细到颗粒度」。
值得一提的是,OpenAI 上个月刚处理过 TanStack npm 供应链攻击事件(5 月 13 日发布的回应),这之后对供应链和沙盒的强调明显增多。在企业销售场景里,「能不能控住智能体」这件事,比模型本身强多少分往往更被买单方关心。
接下来值得盯什么
几个值得继续观察的方向:
- Codex Labs 能不能跑通咨询公司的交付流水线。Accenture、PwC 这种体量的公司决策链非常长,最终会不会真的把 Codex 当成标准交付工具,还是只停留在「试点项目」,这是决定企业级故事能不能讲下去的关键。
- Dell 本地化部署的实际性能损失有多大。云端模型下沉到本地基础设施,推理延迟、模型版本同步、合规审计这些都是硬骨头。
- 白领场景的留存率。开发者用 Codex 是刚需驱动,但销售、运营这些岗位用 Agent 工具的留存往往很差——很多 Agent 产品在演示时惊艳,日常工作流里却用不下去。OpenAI 这次发的内部报告只给了使用案例,没给留存数据,这点要打个问号。
- Atlas + Codex + Deployment Company 这三件套的协同。如果协同顺畅,OpenAI 会形成一个端到端的企业 AI 通路;如果各做各的,就是三个独立产品在打仗。
Codex 这一年的演进路径其实折射出整个 AI Agent 行业的方向——从「能写代码」到「能干活」再到「能在企业里干活」。从开发者工具到企业生产力工具的跨越,从来都不是模型能力堆出来的,而是治理、合规、集成、交付这些「不性感」的工程问题堆出来的。OpenAI 这次集中把这些短板补齐,意图已经很清楚。
参考来源
- TechCrunch 原报道 - OpenAI 发布 Codex 白领工作新工具的首发报道
- OpenAI 官方:Codex Labs 扩展至全球企业 - 联手 Accenture、PwC、Infosys 的企业部署计划
- OpenAI 官方:Codex 应用发布说明 - macOS/Windows 应用的完整能力介绍
- OpenAI × Dell 合作公告 - Codex 进入混合云与本地部署环境的细节