QQ原生接入Hermes Agent,IM+智能体时代来了

产品更新

腾讯QQ宣布原生接入Hermes Agent开源智能体框架,用户可直接在QQ内与自主AI Agent交互,支持文字、语音、图片等消息类型,标志着国内主流即时通讯平台正式拥抱自主智能体生态。

从养龙虾到养马,QQ 这次玩真的了

4月16日,腾讯QQ宣布正式原生接入Hermes Agent——QQ Bot插件已合入Hermes Agent官方代码库,用户可以直接在Messaging Platforms配置中选择QQ Bot通道,把一个能自我进化、拥有跨会话记忆的自主AI智能体,塞进国民级IM应用里。

这件事的意义不在于"又多了一个聊天机器人",而在于:一个月活超过5亿的即时通讯平台,第一次把真正意义上的自主智能体(Autonomous Agent)当作一等公民接入。

QQ Bot接入Hermes Agent的官方配置界面截图

Hermes Agent 是什么?别跟普通聊天机器人搞混

先把概念理清楚。

Hermes Agent由AI研究机构Nous Research开发,2026年2月开源,不到两个月在GitHub斩获超过6万Stars。社区给它起了个外号叫"爱马仕",但它跟奢侈品没关系——跟它的前身OpenClaw(被戏称为"龙虾")倒是一脉相承。

它和市面上绑定在IDE里的编码助手、或者套个API壳子的聊天机器人有本质区别。核心差异在三个地方:

  • 持久化运行:它跑在你自己的服务器上,不是用完即走的一次性对话,而是一个7×24小时在线的常驻进程。
  • 自我进化:内置完整的技能学习闭环——自主创建技能、在使用中改进技能、跨会话召回记忆。用得越多,它越懂你的习惯和需求。
  • 全平台通信:支持15+主流消息平台接入,Telegram、Discord、Slack、WhatsApp、企业微信、钉钉、飞书,现在加上了QQ。

简单说,普通聊天机器人是"你问它答",Hermes Agent是"它住在你的数字世界里,越来越了解你,还能主动干活"。它甚至内置了Cron调度器,你用自然语言跟它说"每天早上9点帮我总结一下昨天的GitHub通知",它就真的会定时执行。

这也是为什么QQ接入它,跟之前接入一个普通Bot完全不是一回事。

接入细节:三步搞定,但魔鬼在细节里

从操作层面看,QQ接入Hermes Agent的流程并不复杂:

  1. 登录QQ开放平台(https://q.qq.com),创建QQ Bot,拿到AppID和AppSecret
  2. 在Hermes Agent中运行配置向导,选择QQ Bot通道
  3. 填入凭证,启动网关服务

用命令行表示大概是这样:

# 如果已有Hermes Agent环境,直接进入网关配置
hermes setup gateway

# 在交互式向导中选择 QQ Bot
# 输入从QQ开放平台获取的 AppID 和 AppSecret
# 完成后安装并启动网关
hermes gateway install

完成接入后,QQ内目前支持文字、语音、图片等消息类型的收发。官方说"更多消息类型和通道能力正在迭代中",这意味着文件传输、富文本卡片、群聊场景等能力大概率在后续版本补齐。

这里有个值得注意的点:Hermes Agent的通道系统设计是"一个后台进程同时连接所有已配置的平台"。也就是说,你可以让同一个Agent同时挂在QQ、企业微信、飞书、Telegram上,共享同一套记忆和技能。你在QQ上教它的东西,切到飞书上它也记得。

这个设计在实际场景中非常实用。比如你是一个小团队的技术负责人,团队内部用飞书沟通,但客户习惯用QQ——同一个Agent可以同时服务两个场景,而且上下文是打通的。

为什么是QQ?为什么是现在?

把这件事放到更大的背景里看,逻辑就清楚了。

腾讯在AI Agent赛道上的布局一直走的是"基础设施"路线,而不是自己下场做Agent产品。两天前的4月14日,腾讯云刚宣布轻量应用服务器Lighthouse上线Hermes Agent专属应用模板,支持一键部署。再往前,OpenClaw(龙虾)火的时候,Lighthouse也是第一时间跟进了云端部署方案。

现在QQ原生接入Hermes Agent,等于腾讯把自己的C端流量入口也开放了出来。这形成了一个完整的链路:

腾讯云Lighthouse提供算力 → Hermes Agent提供智能体框架 → QQ提供用户触达通道

对腾讯来说,这是一步很聪明的棋。它不需要自己做一个Agent产品去跟市场上的玩家竞争,只需要让自己的基础设施和流量入口对开源生态足够友好,开发者自然会涌进来。QQ的月活摆在那里,对于想让Agent触达普通用户的开发者来说,这个通道的吸引力不言而喻。

而从Hermes Agent的角度看,接入QQ意味着它在中国市场的通信覆盖又补上了关键一块。此前它已经支持企业微信、钉钉、飞书,但这三个都是办公场景。QQ覆盖的是更广泛的个人用户和社群场景——游戏社群、学习群、兴趣圈子,这些场景对智能体的需求其实非常旺盛,只是之前没有好的接入方式。

跟竞品比,Hermes Agent的位置在哪?

说实话,2026年的AI Agent赛道已经相当拥挤了。但Hermes Agent能在两个月内拿到6万Stars,确实有它的独到之处。

跟Coze(字节跳动)、文心智能体(百度)这类平台型产品比,Hermes Agent最大的优势是开源和自托管。你的数据、你的记忆、你的技能全部存在自己的服务器上,不依赖任何第三方平台。对于有数据敏感性要求的企业用户,这一点几乎是决定性的。

跟AutoGPT、CrewAI这类开源框架比,Hermes Agent的差异化在于它的"持久性"设计。大多数开源Agent框架还是面向"任务执行"的——你给它一个任务,它执行完就结束了。Hermes Agent是面向"长期陪伴"的,它有持久化记忆,有自我学习机制,有定时任务能力,更像是一个"数字员工"而不是一个"工具"。

当然,它也有明显的短板。目前不支持Windows原生环境(需要WSL2),这一点卡住了不少用户。模型配置需要用户自己搞定API Key,不像一些平台产品开箱即用。对于非技术用户来说,部署门槛还是偏高的——虽然腾讯云Lighthouse的一键部署方案已经大幅降低了这个门槛。

模型选择:灵活是把双刃剑

Hermes Agent在模型层面的设计哲学是"不绑定任何供应商"。它支持OpenAI、Anthropic、DeepSeek、MiniMax、小米MiMo等多家模型,用户可以自由切换。

最近的一个动态是,Nous Research跟小米达成合作,把MiMo V2 Pro引入了Hermes Agent生态,4月8日到4月22日期间通过Nous Portal免费使用。这个模型在多步骤任务规划和代码执行方面表现不错,适合Agent场景。

对于开发者来说,模型的灵活切换能力意味着你可以根据场景选择最合适的模型。比如日常闲聊用成本较低的模型,遇到复杂推理任务再切换到高性能模型。

如果你手头已经有多个模型的API Key,或者在用OpenAI Hub这类聚合服务,Hermes Agent的模型配置就更简单了——本质上它兼容OpenAI格式的API,配置一个兼容端点就能调用各种模型:

# 通过 OpenAI Hub 接入多模型(兼容 OpenAI 格式)
hermes config set OPENAI_API_KEY your-openai-hub-key
hermes config set OPENAI_BASE_URL https://api.openai-hub.com/v1
hermes config set MODEL_NAME gpt-4o  # 或 claude-sonnet-4、deepseek-chat 等

如果你在自己的应用中也想实现类似的多模型调度能力,用OpenAI兼容格式调用不同模型的代码大概长这样:

from openai import OpenAI

client = OpenAI(
    api_key=\"your-openai-hub-key\",
    base_url=\"https://api.openai-hub.com/v1\"
)

# 同一个客户端,切换不同模型
response = client.chat.completions.create(
    model=\"deepseek-chat\",  # 或 gpt-4o、claude-sonnet-4 等
    messages=[
        {\"role\": \"system\", \"content\": \"你是一个QQ群里的智能助手\"},
        {\"role\": \"user\", \"content\": \"帮我总结一下今天群里讨论的重点\"}
    ]
)
print(response.choices[0].message.content)

但灵活也意味着复杂。对于刚接触的用户来说,"选哪个模型"本身就是一个需要经验的决策。这一点上,Hermes Agent的文档和社区引导还有提升空间。

从龙虾到爱马仕:OpenClaw用户怎么迁移?

如果你之前玩过OpenClaw(龙虾),迁移到Hermes Agent的成本很低。官方内置了一键迁移命令:

hermes claw migrate

这条命令会自动迁移OpenClaw的设置、记忆、技能和API密钥。从社区反馈来看,迁移过程基本顺畅,大部分用户几分钟就能完成。

两者的核心差异在于,Hermes Agent在架构层面做了全面升级。记忆系统更持久、技能系统支持自动创建和改进、通道系统覆盖更广。如果说OpenClaw是"能用",Hermes Agent就是"好用"。

不过也有老用户反馈,Hermes Agent的资源占用比OpenClaw更高,最低建议2核4G的服务器配置。如果你之前用的是最低配的1核1G小鸡,可能需要升级一下。

实际场景:QQ + Hermes Agent 能干什么?

说了这么多架构和技术,落到实际场景里,QQ接入Hermes Agent之后能做什么?

几个比较直接的场景:

游戏社群管理:在QQ游戏群里部署一个Agent,它可以自动回答新人问题、整理攻略、定时发布活动提醒。因为有记忆能力,它会记住群里的常见问题,回答越来越精准。

学习小组助手:考研群、编程学习群里,Agent可以帮忙答疑、整理学习资料、追踪每个人的学习进度。你跟它说"每周五晚上8点提醒大家交周报",它就会准时执行。

客服前置:小型电商卖家在QQ上做客服,Agent可以处理80%的常规咨询(尺码、发货时间、退换货政策),只把复杂问题转给真人。

个人数字助理:把Agent当作你的私人助手,帮你管理日程、记录灵感、定时推送你关注的信息源摘要。

当然,目前QQ通道还在早期阶段,只支持文字、语音、图片的基础收发。群聊场景下的@唤醒、富文本卡片、小程序联动等能力还没有,这些大概率会在后续版本中逐步补齐。

冷静看:还有哪些坑?

任何新东西刚出来都不可能完美,QQ接入Hermes Agent这件事也有几个需要注意的地方:

第一,QQ开放平台的Bot审核机制。创建QQ Bot需要在QQ开放平台注册并通过审核,这个流程对个人开发者来说可能有一定门槛,尤其是涉及到Bot的使用场景说明和合规审查。

第二,消息类型的限制。目前只支持基础的文字、语音、图片,对于需要发送文件、Markdown卡片、交互按钮等复杂消息类型的场景,暂时还做不到。

第三,QQ的消息频率限制。QQ开放平台对Bot的消息发送频率有限制,如果你的Agent需要在高活跃度的群里频繁响应,可能会遇到限流问题。

第四,隐私和合规。Hermes Agent的记忆系统会持久化存储对话内容,在QQ群聊场景下,这涉及到群成员的隐私问题。开发者需要自己处理好数据存储和隐私合规。

往前看:IM + Agent 的想象空间

把视角拉远一点,QQ接入Hermes Agent这件事,代表的是一个更大的趋势:即时通讯平台正在从"人与人的通信工具"变成"人与AI的交互界面"。

Telegram在这方面走得最早,它的Bot生态已经非常成熟。Discord靠着游戏和开发者社区,也成了AI Bot的重要阵地。国内这边,企业微信、钉钉、飞书在办公场景里都有了Agent接入能力。

但QQ的加入有特殊意义。它是国内为数不多的、同时覆盖个人社交和社群场景的平台,而且用户群体偏年轻,对新技术的接受度高。如果Hermes Agent在QQ上跑通了,它验证的不只是一个技术方案,而是"自主智能体能不能在大众社交场景里被普通人接受"这个命题。

这个命题的答案,可能比任何技术细节都重要。


参考来源: