VS Code 动手了。
微软刚刚在 VS Code Insiders(预览版)中上线了一个叫 Agents Application 的新模式,形态上直接对标 OpenAI 的 Codex App——不再是你熟悉的那个在侧边栏里陪你聊天的 Copilot 面板,而是一个可以自主规划、执行、调用工具链的 Agent 界面。
下载 VS Code Insiders,执行一条命令就能体验:
Chat: Open Agents Application
没有复杂的配置,没有额外的插件依赖。打开就是一个独立的 Agent 工作区。

这不是又一个聊天窗口
先说清楚它和现有 GitHub Copilot Chat 的区别,因为很多人第一反应是"不就是换了个 UI 吗"。
不是。
传统的 Copilot Chat 本质上是一个问答式的对话框。你问它一个问题,它给你一段代码,你手动复制粘贴到编辑器里,或者点一下"Apply"让它帮你插入。整个过程是人驱动的,AI 只是一个响应器。
Agents Application 模式的逻辑完全不同。你给它一个任务描述——比如"把这个 Express 项目的认证模块从 session 迁移到 JWT"——它会自己去读项目结构、分析依赖关系、制定执行计划、逐步修改文件、运行测试验证结果。整个过程是 Agent 驱动的,你变成了审阅者。
这跟 OpenAI 在今年推的 Codex App 几乎是同一个思路:把 AI 从"补全工具"升级成"自主开发者"。
为什么大厂都在往这个方向跑
如果你一直关注 AI 编程工具这条赛道,会发现 2025 年下半年到 2026 年初,整个行业经历了一次明显的形态分化:
第一阵营:IDE 插件派。 GitHub Copilot、通义灵码、Cursor 的 Tab 补全,都属于这一类。核心价值是"你在写代码的时候帮你写得更快"。这是最成熟的形态,也是目前用户量最大的。
第二阵营:CLI 原生派。 Claude Code、Gemini CLI、Qwen Code、OpenCode,全都是终端里跑的。天然契合 Shell、Git 工具链,脚本化能力强,CI/CD 集成方便。2025 年下半年 CLI 热潮的时候,连 GitHub Copilot 都跟着做了个 CLI 版本——虽然说实话,Agent 自主能力跟 Claude Code 比还差不少,没法自主调用 shell、跑测试、改多文件结构。
第三阵营:独立 App 派。 OpenAI Codex App 是这个方向的开创者,把 Agent 做成一个独立的应用界面,强调的是"把任务丢给它,它自己干完你来验收"。
现在 VS Code 做的事情,是把第三阵营的形态塞回了 IDE 里。
这一步棋很聪明。Codex App 的问题在于它是一个独立产品,开发者需要离开自己熟悉的编辑器环境去用它。而 VS Code 直接在编辑器内部开了一个 Agent 模式,你不用切换上下文,项目文件、终端、Git 状态全都在手边。
说白了,微软想要的是:你既能享受 Agent 自主执行的效率,又不用离开 VS Code 的生态。
行业跟进的速度很说明问题
值得注意的是,不只是 VS Code 在动。社区里已经有人发现 Trae Solo(字节跳动旗下的 AI IDE)也在往类似 Codex App 的模式改。
这说明什么?说明这些大厂在内部测试中大概率已经验证了一件事:对于中大型任务,Agent 自主模式的完成质量和效率,显著优于传统的对话式交互。
想想也合理。你让 AI 帮你重构一个模块,用聊天模式可能要来回对话十几轮,每轮你都得看一遍输出、确认、再给下一步指令。换成 Agent 模式,一次性描述清楚需求,它自己跑完整个流程,你最后 review 一次就行。
当然,这里有个前提:模型的推理能力和工具调用能力得够强。如果模型本身不够聪明,自主执行只会制造更多 bug。这也是为什么这个模式到 2026 年才开始成熟——底层模型的能力终于跟上了。
对开发者意味着什么
说点实际的。
如果你现在的工作流是"VS Code + Copilot 补全 + 偶尔问问 Chat",Agents Application 模式不会取代你现有的习惯,但它会在特定场景下给你一个更高效的选择:
- 跨文件重构
- 从零搭建一个模块的脚手架
- 批量修改 API 接口格式
- 写完代码后自动跑测试、修 bug、再跑测试
这些任务的共同特点是:步骤多、涉及多个文件、需要上下文连贯性。传统的对话模式处理这类任务很吃力,Agent 模式天然适合。
但如果你只是日常写代码需要行级补全和简单问答,现有的 Copilot 体验已经够用了,没必要为了用新功能而用新功能。
CLI 还是 App?可能不是二选一
社区里有一种声音:"大家还是用 CLI 或者插件的多,搞这种独立 App 模式有人用吗?"
这个问题问得好,但可能问错了方向。
看看现在 AI 编程工具的格局:Claude Code 在终端里跑得风生水起,Gemini CLI 开源后社区活跃度很高,Qwen Code 从 v0.2.0 开始独立开发摆脱了对 Gemini CLI 上游的依赖,OpenCode 在 GitHub 上拿了 90k+ stars。CLI 阵营确实很强。
但 CLI 有一个绕不开的门槛:它要求开发者对命令行足够熟悉,对项目结构有清晰的心智模型。对于习惯了 GUI 的开发者来说,在终端里让 AI 改代码,总觉得少了点"看得见"的安全感。
VS Code 的 Agents Application 模式某种程度上是在做一个折中——Agent 的自主能力向 CLI 工具看齐,但交互界面保留在 IDE 里,你能实时看到它在改哪些文件、执行了什么命令、测试结果如何。
最终的趋势大概率是多形态共存:
- 终端重度用户继续用 Claude Code、Gemini CLI 这类工具
- IDE 用户在 VS Code 里用 Agents Application
- 需要异步处理大任务的场景用 Codex App 这类独立产品
工具形态不重要,重要的是底层的 Agent 能力。而这个能力,最终取决于你用的模型够不够强。
模型选择才是真正的变量
不管是 VS Code 的 Agents Application、Codex App、还是 Claude Code,它们本质上都是 Agent 框架——真正干活的是背后的大模型。
目前这些工具默认绑定的模型各不相同:Copilot 用的是 GPT 系列和 Claude,Codex App 用 OpenAI 自家模型,Claude Code 自然是 Claude,Gemini CLI 跑的是 Gemini。
但实际开发中,不同任务适合不同模型。代码生成 Claude 强,长上下文理解 Gemini 有优势,快速迭代 DeepSeek 性价比高。如果你在做 Agent 相关的开发或者想在自己的工具链里集成多模型能力,通过 OpenAI Hub 这类 API 聚合平台可以用统一的 OpenAI 格式调用所有主流模型,省去逐个对接的麻烦:
from openai import OpenAI
client = OpenAI(
api_key=\"your-openai-hub-key\",
base_url=\"https://api.openai-hub.com/v1\"
)
# 同样的代码格式,切换不同模型只需改 model 参数
response = client.chat.completions.create(
model=\"claude-sonnet-4\", # 或 gpt-4o、gemini-2.5-pro、deepseek-r1
messages=[
{\"role\": \"system\", \"content\": \"你是一个代码重构助手\"},
{\"role\": \"user\", \"content\": \"将以下 Express 中间件从 callback 风格重构为 async/await...\"}
]
)
print(response.choices[0].message.content)
尤其是国内开发者,直连可用这一点在实际开发中省了不少折腾。
冷静看一眼
最后说点不那么乐观的。
Agents Application 目前还在 Preview 阶段,稳定性和能力边界都还没经过大规模验证。从社区反馈来看,Copilot 的 Agent 自主能力相比 Claude Code 和 Gemini CLI 还有差距——特别是在工具调用深度、多步推理的准确性上。
微软的优势在于 VS Code 的生态护城河。全球开发者里有相当大比例的人每天打开的第一个应用就是 VS Code,把 Agent 能力直接内置到这个入口里,分发效率是任何独立工具都比不了的。
但能不能留住用户,最终还是看 Agent 干活的质量。如果它自主改完的代码你还得花半小时 review 和修 bug,那还不如自己写。
AI 编程工具的形态之争还远没有结束。VS Code 这一步,至少说明了一件事:编辑器不再甘心只做"编辑"这一件事了。
参考来源:
- VS Code 推出类 Codex App 模式讨论帖 - Linux.do 社区关于 VS Code Agents Application 功能的讨论
- 2026年 AI 编程工具全景测评 - 知乎专栏,覆盖 Claude Code、Gemini CLI、Qwen Code 等主流工具的横向对比