阿里云把百炼塞进了命令行:一句话接入150+模型

产品更新

阿里云今日开源百炼CLI,一行命令让Agent调用150多款模型、十多款应用以及知识库、记忆、联网搜索等全套能力,原生适配Claude Code、Qoder等主流Agent框架。

阿里云今天(5月29日)把百炼的核心能力打包成了一个命令行工具,扔到了 GitHub 上。一行命令,Agent 就能调到平台上 150 多款模型、十多款应用,再加上知识库、记忆、联网搜索这一整套配套设施。

这件事放在 2026 年的当口看,节奏其实挺顺的。过去半年,Agent 这边的事实标准已经从"对话框 + 插件"转向了"终端 + CLI"——Claude Code、Cursor 的 Agent 模式、Qoder、还有一票 Open 系的 Agent 框架,几乎全在围着命令行做文章。模型厂商如果还只提供 HTTP API 和 SDK,就要被夹在中间:上游 Agent 框架要适配你,下游开发者要自己把模型能力翻译成工具调用。百炼 CLI 干的事,就是把这层翻译省掉。

百炼 CLI 终端调用界面示意

CLI 化的意义:不是再做一个 SDK

先把误会澄清掉。百炼 CLI 不是把原来 Python/Java SDK 换个皮变成命令行。它是专为 Agent 设计的——也就是说,它的输出是给另一个 AI 看的,不是给人看的。

这是两个完全不同的设计目标。给人用的 CLI,重点是交互友好、彩色输出、进度条;给 Agent 用的 CLI,重点是结构化输出、参数语义明确、错误码可解析、能被 LLM 一次性理解并正确调用。官方明确说了支持"结构化输出,便于 Agent 工具调用和自动化编排",这句话翻译过来就是:每个子命令的入参出参都按照 function calling 的规范来组织,Claude Code 这类 Agent 能直接把它当成工具集挂载进去。

对照一下原生支持的几个框架名单——Claude Code、Qoder、OpenClaw、Hermes Agent——基本覆盖了当前主流的编码 Agent 和通用 Agent 两条路线。Claude Code 是 Anthropic 自家的终端 Agent,Qoder 是阿里前段时间推的 IDE Agent,后两个是开源社区的代表。这个适配清单意味着,用户不用自己写 MCP server 或者自定义工具描述,装完 CLI 就能在这些 Agent 里直接用。

能力清单:把"百炼"打包成工具集

按官方披露的能力盘点,百炼 CLI 现在可以让 Agent 干这些事:

  • 多模态模型调用:文本、图像、视频、语音、视觉理解,覆盖 150+ 模型
  • 应用与工作流调用:直接调用在百炼控制台搭好的应用和 Workflow
  • 知识库检索:RAG 链路开箱即用
  • 记忆库管理与用户画像:长程记忆、个性化
  • 联网搜索:让 Agent 获取实时信息
  • 本地文件上传与多模态文件处理:把本地图片、文档、音视频喂给模型
  • 结构化输出:可被上层 Agent 编排消费

这个清单的潜台词是:百炼把自己平台上能用的东西,几乎全部 CLI 化了。过去你想让一个 Agent 同时具备"读本地图片 → 用 Qwen-VL 看懂内容 → 调用图像编辑模型生成营销图 → 查知识库确认品牌指南 → 写文案"这一整串能力,得自己写好几层 glue code。现在 Agent 可以自己分步骤调命令,glue code 由 LLM 在运行时即兴生成。

官方举的几个场景也很说明问题:让 Agent 联网搜最新信息、读本地图编辑成营销素材、结合知识库和记忆构建企业级助手。这三个例子分别覆盖了"实时性、多模态、上下文"三个 Agent 最常被卡住的点。

为什么是现在?

这事得放在更大的背景里看。

阿里这一波动作不是孤立的。再往前推几个月,他们陆续推过 Kilo CLI——专门给 Qwen3-Max、Qwen3-Coder 系列做的编码 CLI;再之前 Qwen3.7-Max 主打"面向智能体时代",强调长周期自主执行和 MCP 集成。一条线索很清楚:阿里在把百炼从一个 MaaS 平台,往"Agent 运行时"这个方向重新定位。

百炼 CLI 是这条线上最关键的一块拼图。Kilo CLI 解决的是"在 Agent 里用 Qwen 写代码",覆盖编码场景;百炼 CLI 解决的是"在 Agent 里用阿里云全套 AI 能力做事",覆盖通用场景。两者其实是互补的——前者偏向 IDE 内的代码助手,后者偏向通用 Agent 工作流。

更现实一点说,国内大模型平台过去一年都在卷"应用层",做应用市场、做工作流编辑器、做记忆库、做知识库。但这些东西要真正被开发者用起来,最大的阻力其实是"接入成本"——每个能力都是一套 API,每个 API 都得读文档、写 client、调参数。Agent 时代,这套打法行不通了,因为 Agent 不会自己读文档。所以把所有能力 CLI 化、并且专门给 Agent 优化输出格式,本质上是给 Agent 做产品适配。

跟 MCP 比,怎么看?

开发者看到这个新闻,第一个反应大概率是:这跟 MCP(Model Context Protocol)有什么关系?要不要二选一?

两个东西的定位其实不一样。MCP 是协议,定义的是 Agent 和工具之间怎么通信;百炼 CLI 是工具集,是阿里云能力的具体封装。理论上,百炼 CLI 完全可以被包装成一个 MCP server,让任何支持 MCP 的 Agent 调用。

但走 CLI 这条路有几个现实优势:

  1. 零配置启动:MCP server 需要起进程、配 schema、管生命周期,CLI 装完直接能用
  2. 跨 Agent 框架兼容性更好:不是所有 Agent 都支持 MCP,但几乎所有 Agent 都支持"调用 shell 命令"
  3. Debug 友好:人类直接在终端里跑一遍命令,能立刻看出哪里出了问题,MCP 的调试链路要长得多

所以可以预期,后面这两条路线大概率是并行的:CLI 作为最低门槛的入口,MCP 作为更深度集成的方式。

一些值得关注的细节

几个翻文档时注意到的点:

  • GitHub 仓库地址是 modelstudioai/cli,不在 alibaba 主组织下面,估计是百炼海外品牌 ModelStudio 的独立运营。这种命名也说明这个东西不只是给国内开发者用的,海外站点(新加坡、弗吉尼亚)也都同步支持。
  • 结合 Coding Plan 看,百炼前段时间已经推了类似 Claude Code Max Plan 的订阅制套餐,CLI 化之后这套订阅的价值会被放大——一次订阅,所有 Agent 框架都能用。
  • Qwen3.7-Max 刚发布,定位就是"面向智能体时代"。模型层、CLI 层、订阅层这三块拼起来,阿里这次的产品节奏明显是有规划的。

给开发者的建议

如果你正在做基于 Claude Code 或者 Qoder 的 Agent 应用,百炼 CLI 值得花半小时试一下,特别是涉及多模态(图像编辑、视频生成、语音合成)的场景——这些能力自己接 API 真的烦,CLI 化之后省心很多。

如果你在做企业内部的智能助手,结合"知识库 + 记忆 + 联网搜索"这三件套,百炼 CLI 提供了一个比较完整的现成方案,至少 PoC 阶段不用自己拼基础设施。

如果你做的是纯文本对话类应用,那其实直接用 OpenAI 兼容接口就够了,CLI 的优势体现不出来。顺带一提,OpenAI Hub 也支持 Qwen 系列模型的直接调用,OpenAI 格式兼容,国内直连,做对比测试或者多模型路由的时候挺方便。

这次百炼 CLI 开源是个标志性事件,但还需要时间观察的几件事:一是 Agent 框架适配的稳定性,特别是工具描述的语义清晰度;二是结构化输出对复杂任务的支持深度;三是开源社区会不会跟进,贡献更多上层封装。

命令行回归是这两年最有意思的产品趋势之一。模型厂商终于意识到,给 Agent 做产品和给人做产品是两件事——前者要的是"清晰、可调用、可组合",后者要的是"好看、好用、好理解"。百炼 CLI 这次明显是奔着前者去的。

参考链接