QClaw v0.2.14:腾讯的Agent野心藏不住了

产品更新

腾讯 QClaw 发布迄今最大幅度更新,接入 Hermes 框架实现双 Agent 内核并行,底层模型切换至 DeepSeek-V4-Pro 与混元 Hy3 preview,同步上线专家广场、团队协作等多项能力。

腾讯今天把 QClaw 推到了 v0.2.14,官方称这是"迄今为止力度最大的一次版本更新"。这话在科技圈已经快成月经式表达了,但这次翻完更新日志,我觉得腾讯没怎么吹牛。

一句话概括:QClaw 从一个能跑 Agent 的桌面工具,开始往 Agent 操作系统的方向走了。

Hermes 框架接入:一个壳里跑两种 Agent

这次更新最值得关注的变化是 QClaw 正式接入了 Hermes 框架。

如果你之前没跟进过 Hermes——这是一个专注于多步推理和工具调用的 Agent 框架,和 QClaw 原生的 Agent 内核走的是不同的技术路线。QClaw 原生内核更偏向对话式交互和 Skill 编排,Hermes 则在复杂任务分解和自主决策上更有优势。

现在 QClaw 把两者塞进了同一个应用里。用户可以在创建 Agent 时选择内核类型——要么用 QClaw 原生的,要么用 Hermes 的。搜狐的报道里用了一个很形象的比喻:"养虾又养马"。虽然有点土,但确实说到点子上了。

这意味着什么?

对开发者来说,你不用再纠结"我这个场景到底该用哪个框架"的问题。简单的对话式任务用原生内核,需要多步推理、复杂工具链编排的任务切 Hermes,在同一个工作空间里完成。这比你同时开两个工具、在两套体系之间来回切换要优雅得多。

对腾讯来说,这步棋下得很聪明。与其和 Hermes 竞争,不如把它吸收进来。Agent 框架这个赛道现在群雄混战,LangChain、CrewAI、AutoGen 各有拥趸,腾讯选择做"框架的框架",把自己的定位从 Agent 运行时拉高到 Agent 平台层。

QClaw v0.2.14 创建 Agent 时选择 Hermes 或原生内核的界面截图

不过有一点需要观察:双内核并行的稳定性和资源占用情况。两种 Agent 内核的调度逻辑、上下文管理、工具调用协议都不一样,QClaw 在中间做的适配层到底有多厚、性能损耗有多大,这些得等社区实际跑起来才知道。

底层模型大换血:从"我帮你选"到"你自己挑"

之前 QClaw 的底层模型是固定的,平台给你配什么你就用什么。v0.2.14 把这个限制彻底打开了——用户可以自由切换模型,也可以让系统智能匹配。

目前支持的模型列表:

  • 混元 Hy3 preview:腾讯混元架构重建后的首个模型,混合专家架构(MoE),总参数 295B,激活参数 21B,最大支持 256K 上下文
  • DeepSeek-V4-Pro:4 月 24 日刚发布的开源模型,总参数 1.6T,激活参数 49B,上下文长度达到 1M
  • KIMI-K2.6:月之暗面的最新版本
  • GLM-5.1:智谱的最新一代

这个模型阵容挺有意思。

先说 Hy3 preview。295B 总参数、21B 激活参数,这个配比说明腾讯在混元重建后走的是效率路线——用更大的专家池但更少的激活参数来平衡效果和推理成本。256K 的上下文对于 Agent 场景来说基本够用,毕竟大多数 Agent 任务的上下文消耗集中在工具调用的中间结果上,很少有单轮对话就打满 256K 的情况。

再说 DeepSeek-V4-Pro。1.6T 总参数、49B 激活参数、1M 上下文——这组数字放在三天前刚发布的语境下看,QClaw 的跟进速度相当快。1M 上下文在 Agent 场景下的实际价值比在纯对话场景下大得多:Agent 需要处理大量的工具返回结果、历史操作记录、文件内容,长上下文能显著减少信息丢失。

值得注意的是积分体系的变化。QClaw 把原来的 Token 计数改成了按任务类型和所用模型匹配积分额度。这个改动对用户来说是好事——你不用再精打细算每次调用消耗了多少 Token,而是按"完成一个任务"来计费。但反过来说,这也意味着定价的透明度降低了,用户更难预估成本。

对于开发者来说,模型自由切换这个能力的实际意义在于:你可以根据任务复杂度动态选择模型。简单的文本处理用轻量模型省积分,复杂的代码生成或数据分析切到 DeepSeek-V4-Pro 或 Hy3 preview 拿效果。这种灵活性在 Agent 场景下尤其重要,因为一个完整的 Agent 工作流里往往包含难度差异很大的子任务。

顺带一提,DeepSeek-V4-Pro 和混元 Hy3 preview 这类新模型,如果你想在自己的项目里通过 API 调用,OpenAI Hub 也已经跟进支持了,一个 Key 就能切换,省去了分别申请各家 API 的麻烦。

"专家广场":把 Prompt Engineering 的门槛踩到地上

原来的"灵感广场"升级成了"专家广场",内置超过 100 个按行业和场景分类的 AI 专家。

这个功能的目标用户很明确:不会写 Prompt、不懂 Skill 配置、甚至不知道 Agent 是什么的普通用户。交互流程被简化到三步——选专家、说需求、拿结果。

坦白说,这个思路不新。ChatGPT 的 GPTs、Coze 的 Bot Store、百度的灵境矩阵,大家都在做类似的事情。但 QClaw 的差异点在于它把专家和 Agent 能力绑定了——这些专家不只是一个预设好的 Prompt 模板,它们背后跑的是完整的 Agent 工作流,能调用连接器、访问外部数据、执行多步操作。

举个例子:你选了一个"数据分析专家",告诉它"帮我分析百度网盘里那个 Q1 销售数据的 Excel",它能通过百度网盘连接器拉取文件、解析数据、生成分析报告。这比单纯的对话式 AI 助手要实用得多。

每个专家拥有独立人设和隔离的会话空间,这个设计也值得说一下。隔离意味着你和"代码开发专家"聊的内容不会污染"内容创作专家"的上下文,不同专家之间的记忆是独立的。对于同时处理多个项目的用户来说,这种隔离性很有必要。

首期覆盖的领域包括内容创作、数据分析、代码开发等。说实话,100 个专家这个数字听起来不少,但质量比数量重要得多。如果每个专家都只是换了个名字和开场白的通用 Prompt,那和没有也差不多。这个得看后续社区的实际反馈。

微信小程序升级:手机变成 Agent 遥控器

远程操控是 QClaw 一直在推的差异化能力,这次小程序端的升级力度不小:

  • 语音交互:可以通过语音远程下达指令,不用打字
  • 文件共享:支持将 Agent 生成的文件直接分享给微信好友
  • 一键绑定云端实例:支持绑定 Lighthouse 云服务器上的 Agent 实例,本地和云端统一管理

语音交互这个功能看起来简单,但在远程操控场景下很实用。想象一下:你在通勤路上,突然想起需要让 Agent 跑一个数据处理任务,掏出手机对着小程序说一句就行了,不用在手机键盘上费劲打字。

文件共享和微信生态的结合也很自然。Agent 生成了一份报告,你直接在微信里转发给同事——这个工作流比"先下载到本地、再打开微信、再发送文件"要顺滑得多。

但最有想象空间的是云端实例绑定。这意味着 QClaw 的 Agent 不再局限于你的本地电脑,它可以跑在云端 7×24 小时不间断工作,而你通过微信小程序随时随地监控和调度。对于需要长时间运行的 Agent 任务(比如持续监控某个数据源、定时生成报告),这个能力是刚需。

腾讯在这里的优势是显而易见的:微信 + 腾讯云 + QClaw 形成了一个闭环。其他 Agent 工具想做远程操控,要么自己开发 App,要么借助第三方通讯工具,都没有腾讯这种"自家人"的整合度。

连接器扩展:Agent 的手越伸越长

新增四个连接器:

连接器 能力
百度网盘 访问和操作网盘中的文件
携程 查询行程、航班、酒店等信息
飞猪 查询行程、旅游产品信息
腾讯新闻 获取新闻内容摘要

连接器的数量和质量直接决定了 Agent 的实际可用性。一个什么外部服务都访问不了的 Agent,本质上就是一个套了壳的聊天机器人。

这次新增的四个连接器覆盖了文件存储和出行两个高频场景。百度网盘的接入尤其值得关注——国内用户的个人文件很大一部分存在百度网盘里,Agent 能直接读取和操作这些文件,省去了手动上传下载的步骤。

携程和飞猪同时接入也很有意思。两个都是 OTA 平台,功能高度重叠,QClaw 选择都接,大概是为了覆盖更多用户的使用习惯——有人习惯用携程,有人习惯用飞猪。从 Agent 的角度看,同时接入两个平台还有一个好处:可以做比价。让 Agent 同时查两个平台的机票酒店价格,自动选最优方案,这个场景是成立的。

团队协作:基于腾讯文档的 Agent 共享

这次还上线了基于腾讯文档的 Agent 团队协作功能。

具体细节官方披露得不多,但从"基于腾讯文档"这个描述来推测,大概率是把 Agent 的配置、Skill、工作流等以文档形式存储,团队成员可以像协作编辑文档一样共同维护和使用 Agent。

这个方向是对的。目前大多数 Agent 工具都是单人使用的,团队协作基本靠"导出配置文件然后发给同事"这种原始方式。如果 QClaw 能把 Agent 的协作体验做到接近腾讯文档的水平,那在企业场景下会很有竞争力。

但也要看到,Agent 协作比文档协作复杂得多。文档协作的核心是文本内容的同步,而 Agent 协作涉及配置、权限、运行状态、历史记录等多个维度。这个功能的成熟度还需要时间验证。

整体判断:QClaw 在下一盘什么棋?

把 v0.2.14 的所有更新放在一起看,腾讯的意图很清晰:

QClaw 不想只做一个 Agent 工具,它想做 Agent 时代的操作系统。

Hermes 框架接入 = 支持多种 Agent 内核(类比操作系统支持多种应用架构) 模型自由切换 = 底层算力可插拔(类比操作系统的驱动层) 连接器扩展 = 外设和服务的接入能力(类比操作系统的 I/O) 专家广场 = 应用商店 团队协作 = 多用户权限管理 微信小程序远程操控 = 移动端入口

这个布局的野心不小。目前国内做 Agent 平台的玩家不少——Coze(字节)、文心智能体(百度)、通义星尘(阿里)——但大多还停留在"帮你搭 Agent"的阶段。QClaw 这次更新试图往上走一层,做"帮你管理和运行所有 Agent"的平台。

当然,v0.2.14 毕竟还是 0.x 版本,很多功能的完成度和稳定性还有待验证。Hermes 框架的接入深度、双内核的协同效率、连接器的实际可靠性,这些都需要开发者社区的实际检验。

但方向是对的。Agent 赛道正在从"谁的模型更强"转向"谁的生态更完整",腾讯手里的微信、腾讯云、腾讯文档这些牌,在 Agent 平台化这个方向上确实有天然优势。

接下来值得关注的是:QClaw 什么时候开放第三方 Agent 内核的接入协议?如果它真的想做 Agent OS,光支持自家内核和 Hermes 是不够的,得让 LangChain、CrewAI 这些框架也能跑在上面。那才是真正的平台。


参考来源