OpenAI给Codex装上白领工具箱:从写代码扩到知识工作

产品更新

OpenAI 在 6 月 2 日为 Codex 推出一整套企业向新能力,目标是把这个智能体工具从开发者圈子推向更广义的白领工作场景。同时联手 Accenture、PwC、Dell 等做企业落地,周活已突破 400 万开发者。

OpenAI 在周二(6 月 2 日)一口气给 Codex 塞了一整套新能力,意图很明显:不只是想让它继续在工程师的终端里跑,而是要把这个智能体推到更多白领的桌面上。同时发布的还有一份内部报告,专门讲 Codex 在知识工作场景里的使用情况——说白了,这家公司开始正式认真做企业市场了。

从去年底 GPT-5.2-Codex 发布、再到今年 3 月 macOS 应用上线、4 月集成原生浏览器、5 月 Windows 版跟进,Codex 这条产品线在过去半年里几乎是按月迭代的节奏。这一次的更新更像是一个汇总性的阶段总结:能力上从「写代码的智能体」转向「用代码完成任务的智能体」,商业上则补齐了企业部署的最后一公里。

OpenAI Codex 企业版工具套件发布示意图

这次到底更新了什么

核心动作可以拆成三块来看。

第一块是 Codex Labs,OpenAI 把它定位成「把 Codex 扩展到全球企业」的承载形态。合作伙伴清单里出现的是 Accenture、PwC、Infosys 这三家——都是典型的全球咨询和系统集成大厂。这个组合很有意思:OpenAI 自己不擅长做企业级交付,但这些咨询公司每年要给世界 500 强写无数行代码、做无数次系统集成。把 Codex 塞进它们的交付流水线里,等于直接接入了财富 500 强的软件生命周期。

第二块是和 Dell 的合作,把 Codex 带到混合云和本地部署环境。这个动作针对的是金融、医疗、政府这类「数据不能出墙」的客户。Codex 将接入 Dell AI Data Platform,未来还会探索与 Dell AI Factory 的整合。简单理解:以前你要用 Codex,得把代码和上下文交给云端;现在它可以下沉到你自己的机房里,贴着你的代码库、文档、业务系统跑。对那些一听到「数据出域」就摇头的合规部门来说,这扇门终于打开了。

第三块才是产品本身的能力扩展,也是最值得开发者细看的部分:

  • 后台代理可见性:管理员可以在没有用户在场的情况下,查看 Codex 在通用应用中的交互记录。这是个企业治理的必要补丁——你不可能让一个智能体在公司里到处跑,却完全不知道它在干嘛。
  • Mac 应用支持通用应用控制:Codex 现在可以直接驱动那些没有 API 接口的桌面应用。这一点其实是过去半年所有 Agent 产品都在卷的方向,但 OpenAI 把它做进了原生应用而不是浏览器扩展,意味着可控性和稳定性会更好一些。
  • 长时间任务自动化:Codex 可以执行最长 8 小时的后台任务,并在指定时间自动启动。这条路径其实和 3 月份发布的 Automation 功能一脉相承,但把执行窗口从分钟级拉到了小时级。
  • 新版预览页面:用户可以直接看到 Codex 生成的网页效果,定位标注还能精准锚定到具体元素。这部分是 4 月份原生浏览器集成的延续。
  • 图像模型升级到 gpt-image-1.5:生成更快、保真度更高。Codex 应用里那个 $imagegen 命令的产出质量应该会有可感知的提升。

知识工作场景:这不是程序员的玩具了

OpenAI 这次同时发布的内部报告里有个关键判断:Codex 的用户已经溢出了开发者群体。

看 OpenAI 给出的几个典型用例就知道方向在哪——

  • 在多个工具之间收集背景信息、准备报告
  • 分流产品反馈意见
  • 评估潜在销售线索、撰写跟进邮件
  • 协调跨业务系统的工作流

这些场景和「写代码」基本没关系了,更像是把销售、市场、运营、PM 这些岗位的日常重复劳动包出去。Codex 团队产品负责人 Thibault Sottiaux 在采访里说得也很直白:「在我们公司内部,Codex 正在为每个人服务,逐步接入到所有应用程序中。」

这套逻辑其实和 OpenAI 5 月份成立的「Deployment Company」(OpenAI Deployment Company)是同一条线——后者就是专门帮企业把 AI 集成进现有业务的咨询/交付实体。再加上 Atlas 浏览器项目、Codex 桌面应用,三块拼图开始合上:网页端 Atlas、操作系统层 Codex、垂直业务层 Deployment Company,OpenAI 是想把企业 AI 这个市场从入口到交付端到端吃下来。

数据说话:周活破 400 万

几个值得记一下的数字:

  • Codex 周活跃用户(WAU)已经突破 400 万开发者
  • 自 GPT-5.2-Codex 去年 12 月中旬发布以来,整体使用量翻了一番
  • 过去一个月有超过 100 万开发者在使用 Codex

400 万 WAU 是个什么概念?作为对比,GitHub Copilot 在 2025 年中披露的数字是 1500 万付费订阅用户。但 Copilot 已经卷了快五年,Codex 从重启到现在不过一年多。OpenAI 自己也承认,Codex 已经是「增长最快的企业产品之一」。

这个增速能解释为什么 Anthropic、Google 都在拼命追。Claude Code 在企业级控制和 Agent SDK 上更激进,Cursor 走纯编辑器路线,Cognition 的 Devin 主打全自动工程师——但从生态厚度看,Codex 现在的优势是它背靠 ChatGPT 那 8 亿月活用户池,订阅渠道、品牌认知、模型迭代都是现成的。

和友商比,Codex 现在站在哪里

几个比较关键的差异点:

维度 Codex Claude Code Cursor
形态 原生应用 + CLI + IDE 扩展 + 网页 CLI + Agent SDK 编辑器
长任务 最长 8 小时后台 Skills + 长上下文 偏交互式
企业部署 Codex Labs + Dell 本地化 企业控制台 较弱
知识工作扩展 强(白领场景) 强(Skills)
浏览器 原生集成 Computer Use

Codex 的策略明显是「全面铺开」,从开发者一直延伸到非技术岗位。Claude Code 走的是「深耕开发者+企业控制」,Cursor 则继续守住「最好用的 AI 编辑器」这块阵地。对独立开发者来说,问题已经不是哪个模型更强,而是哪种工作面更贴合你的日常节奏。

一个值得注意的安全设计

这次更新里有个容易被忽略的细节:Codex 的「通用应用控制」是建立在原生沙盒之上的。Codex 应用和 CLI 共用同一套开源、可配置的系统级沙盒——默认情况下,智能体只能在自己的工作目录或分支里改文件,使用缓存的网页搜索,需要联网或更高权限时才会请求许可。

企业管理员可以为团队配置规则,允许特定命令在需要时自动以更高权限运行。配合这次新增的后台代理可见性,整个治理闭环开始成型:沙盒隔离 + 权限规则 + 审计可见性。这一套东西在 Dell 本地化部署的场景里尤其关键,因为本地部署的潜台词就是「数据极度敏感,权限必须细到颗粒度」。

值得一提的是,OpenAI 上个月刚处理过 TanStack npm 供应链攻击事件(5 月 13 日发布的回应),这之后对供应链和沙盒的强调明显增多。在企业销售场景里,「能不能控住智能体」这件事,比模型本身强多少分往往更被买单方关心。

接下来值得盯什么

几个值得继续观察的方向:

  1. Codex Labs 能不能跑通咨询公司的交付流水线。Accenture、PwC 这种体量的公司决策链非常长,最终会不会真的把 Codex 当成标准交付工具,还是只停留在「试点项目」,这是决定企业级故事能不能讲下去的关键。
  2. Dell 本地化部署的实际性能损失有多大。云端模型下沉到本地基础设施,推理延迟、模型版本同步、合规审计这些都是硬骨头。
  3. 白领场景的留存率。开发者用 Codex 是刚需驱动,但销售、运营这些岗位用 Agent 工具的留存往往很差——很多 Agent 产品在演示时惊艳,日常工作流里却用不下去。OpenAI 这次发的内部报告只给了使用案例,没给留存数据,这点要打个问号。
  4. Atlas + Codex + Deployment Company 这三件套的协同。如果协同顺畅,OpenAI 会形成一个端到端的企业 AI 通路;如果各做各的,就是三个独立产品在打仗。

Codex 这一年的演进路径其实折射出整个 AI Agent 行业的方向——从「能写代码」到「能干活」再到「能在企业里干活」。从开发者工具到企业生产力工具的跨越,从来都不是模型能力堆出来的,而是治理、合规、集成、交付这些「不性感」的工程问题堆出来的。OpenAI 这次集中把这些短板补齐,意图已经很清楚。

参考来源