智源发布ClawKeeper开源安全框架：Skill-Plugin-Watcher三层架构守护OpenClaw智能体

智源联合北邮、信通院发布ClawKeeper v1.0，以Skill-Plugin-Watcher三层架构为OpenClaw智能体提供全生命周期安全防护，直面本地全能智能体的高危攻击面。

OpenClaw 的安全问题终于等来了一个系统性的回应。

近日，北京智源人工智能研究院联合北京邮电大学、中国信息通信研究院发布了 ClawKeeper v1.0——一个专门为 OpenClaw 智能体生态打造的开源安全框架。项目已在 GitHub 开源，论文同步放出。

这不是又一个「安全最佳实践文档」，而是一套可以跑起来的、用智能体监管智能体的实时防御系统。

OpenClaw 到底有多危险？

要理解 ClawKeeper 的价值，得先看清楚它要解决的问题有多棘手。

当前主流的 AI 智能体大致分三类：应用层智能体（豆包、千问上的那些）、云端沙箱智能体（Manus、HaloMate）、以及本地智能体（Claude Code、Gemini CLI）。前两类要么能力有限，要么跑在沙箱里翻不出花；第三类虽然能操作本地资源，但采用零信任策略，每条命令都要用户点头才能执行。

OpenClaw 是个异类。它在默认配置下对技能调用和命令执行不加限制、无需授权，是真正意义上的「本地全能智能体」。能力越大，攻击面越大。

数字很说明问题。根据绿盟科技今年 4 月初的安全分析报告，OpenClaw 相关的 CVE 漏洞在 2026 年 2 月达到披露峰值，集中暴露了沙箱逃逸和指令执行方面的问题。漏洞的严重程度分布更让人捏把汗：

严重（Critical）占 12%，可导致远程代码执行、管理员权限获取或 API Key 直接泄露
高危（High）占 58%，涉及沙箱逃逸、特权提升、大规模数据泄露
两者合计 70%

漏洞类型上，不当授权（CWE-285）占 42%，OS 命令注入（CWE-78）占 22%，路径穿越（CWE-22）占 18%。攻击面高度集中在插件集成和外部 Webhook 这些智能体与外部系统交互的关口。

OpenClaw 漏洞严重程度分布饼图，展示 Critical 12%、High 58%、Medium 和 Low 合计 30%

供应链的情况同样不乐观。2026 年 2 月，安全公司 Snyk 对 ClawHub 和 skills.sh 上的 3984 个第三方技能做了扫描，结果是：13.4%（534 个）包含严重安全问题，包括恶意软件、凭据窃取和提示词注入；36.8%（1467 个）至少存在一个安全漏洞，比如硬编码的 API 密钥。

更具标志性的事件是今年 1 月底到 2 月中旬的「ClawHavoc」供应链投毒攻击——攻击者通过 ClawHub 分发伪装成正常技能的 Atomic macOS Stealer，被 Trend Micro 和 OpenSourceMalware 联合发现。这不是理论上的风险，是已经发生过的真实攻击。

简单说，OpenClaw 的安全现状就是：一个权限几乎不设防的本地全能智能体，跑着一个三分之一技能都有安全隐患的生态市场，还已经被攻击者盯上了。

ClawKeeper 的三层防御架构

ClawKeeper 的核心设计思路是「纵深防御」，但它没有选择简单地给 OpenClaw 加一堵墙，而是设计了三个各司其职又相互配合的防御层：Skill（技能）、Plugin（插件）、Watcher（观察者）。

这个架构的巧妙之处在于，它用 OpenClaw 自身的扩展机制来实现安全防护——用智能体的方式去监管智能体。

第一层：Skill（技能层防御）

这是最内层的防护，直接作用在智能体执行技能的环节。你可以把它理解为给每个技能调用加了一道安检门。

Skill 层主要做两件事：一是对技能的输入输出做实时校验，拦截异常参数和可疑返回值；二是对技能本身做静态分析，在加载阶段就识别出潜在的恶意代码模式。考虑到 ClawHub 上超过三分之一的技能存在安全问题，这层防护的必要性不言而喻。

对于开发者来说，这意味着你不需要逐个审计每个第三方技能的源码，ClawKeeper 会在运行时帮你把关。当然，它不能替代人工审计，但至少把最明显的风险挡在了外面。

第二层：Plugin（插件层防御）

Plugin 层处理的是智能体与外部系统交互的安全问题——也就是前面提到的漏洞重灾区。

这一层重点防御的场景包括：Webhook 集成（Discord、Slack、Matrix 等）的权限校验、API 调用的凭据保护、以及外部数据输入的消毒处理。还记得那 42% 的不当授权漏洞吗？Plugin 层就是冲着这个来的。

它的工作方式类似于传统 Web 应用中的中间件：拦截所有进出智能体的外部通信，按预定义的安全策略做过滤和校验。不同的是，这些策略可以根据部署环境动态调整，这对局域网内的智能体集群管理尤其重要。

第三层：Watcher（观察者层防御）

这是最外层，也是 ClawKeeper 最有意思的一层。

Watcher 本质上是一组独立运行的监控智能体，它们不参与业务逻辑，只负责观察其他智能体的行为模式。当检测到异常行为——比如某个智能体突然开始大量读取不相关的文件、尝试访问未授权的网络地址、或者执行与其任务描述不符的系统命令——Watcher 会触发告警甚至直接阻断。

这就是「用智能体监管智能体」的核心含义。传统的规则引擎只能匹配已知的攻击模式，而 Watcher 智能体可以理解上下文，判断一个行为在当前场景下是否合理。比如，一个负责文档整理的智能体去读取 ~/.ssh/ 目录，规则引擎可能需要你手动配置黑名单路径，但 Watcher 可以直接判断「这不对劲」。

当然，用 AI 监管 AI 本身也引入了新的问题——监管者自身的可靠性怎么保证？ClawKeeper 的做法是让 Watcher 运行在独立的、权限受限的进程中，并且 Watcher 之间可以交叉验证。这不是完美方案，但在工程上是务实的。

跟同类方案比，ClawKeeper 的位置在哪？

智能体安全不是一个新话题。最近几个月，这个方向上的开源项目密集涌现：

| 项目 | 主要思路 | 侧重点 | |------|---------|--------| | ClawKeeper | Skill + Plugin + Watcher 三层架构 | OpenClaw 生态全生命周期防护 | | ClawAegis（蚂蚁+清华） | 全链路纵深防御插件 | 五阶段覆盖，偏通用智能体 | | MCP Guardian | 安全优先的中间层 | MCP 协议层面的防护 | | ShieldAgent | 可验证安全策略推理 | 形式化验证方向 | | LlamaFirewall（Meta） | 护栏系统 | 通用 LLM 智能体防护 |

ClawKeeper 的差异化很明确：它是专门为 OpenClaw 生态定制的。这既是优势也是局限——针对性强意味着防护更到位，但也意味着如果你用的不是 OpenClaw，这套方案的适用性会打折扣。

相比蚂蚁和清华联合开源的 ClawAegis，ClawKeeper 的 Watcher 机制是一个明显的差异点。ClawAegis 更偏向传统的规则+策略路线，而 ClawKeeper 引入了智能体级别的行为监控，理论上对未知攻击模式的适应性更好。但 ClawAegis 的通用性更强，不绑定特定的智能体框架。

值得注意的是，这些项目并不互斥。在实际部署中，完全可以在 MCP 协议层用 MCP Guardian，在 OpenClaw 运行时层用 ClawKeeper，形成更完整的防御纵深。

对开发者意味着什么？

如果你正在用 OpenClaw 构建智能体应用，ClawKeeper 基本上是现阶段的必选项。原因很简单：OpenClaw 默认配置下的安全模型太过宽松，而你不可能手动审计生态中的每一个第三方技能。

部署上，ClawKeeper 特别适合局域网内的智能体集群场景——比如企业内部部署的多智能体协作系统。在这种场景下，智能体之间的通信频繁，攻击面大，但又不能像公有云那样依赖外部安全服务，ClawKeeper 的本地化部署和 Watcher 机制正好对症。

对于通过 API 调用各类模型来驱动智能体的开发者，安全防护需要从模型调用层就开始考虑。比如你用 OpenAI Hub 这类聚合平台统一调用 GPT、Claude、Gemini 等模型的 API，那么在智能体的 system prompt 中就应该内置安全约束，再配合 ClawKeeper 的运行时防护，形成从模型层到执行层的完整链路。

一个典型的安全加固调用示例：

from openai import OpenAI

client = OpenAI(
    base_url="https://api.openai-hub.com/v1",
    api_key="your-api-key"
)

# 在 system prompt 中内置安全约束
response = client.chat.completions.create(
    model="gpt-4o",
    messages=[
        {
            "role": "system",
            "content": (
                "你是一个受安全策略约束的智能体。执行任何文件操作前必须校验路径合法性，"
                "禁止访问用户主目录之外的敏感路径，禁止执行未经白名单授权的系统命令。"
                "所有外部 API 调用必须通过安全代理层。"
            )
        },
        {
            "role": "user",
            "content": "帮我整理 ./documents 目录下的文件"
        }
    ]
)

print(response.choices[0].message.content)

当然，system prompt 层面的约束只是第一道防线，容易被提示词注入绕过。真正的安全还是要靠 ClawKeeper 这类运行时框架在执行层做硬拦截。

更大的背景

ClawKeeper 的发布不是孤立事件，它是整个行业对智能体安全问题集体觉醒的一部分。

今年 3 月，新修改的《网络安全法》明确要求加强人工智能风险监测评估和安全监管。政策层面的信号已经很清晰：智能体不是想怎么跑就怎么跑的。

从技术社区的反应看，2026 年 Q1 是智能体安全方案的集中爆发期。ClawKeeper、ClawAegis、MCP Guardian、ShieldAgent、LlamaFirewall……几乎每周都有新的安全框架或工具发布。这说明两件事：第一，智能体的安全问题确实严峻到了不得不解决的地步；第二，行业还没有形成统一的安全标准和最佳实践，大家都在摸索。

对于 OpenClaw 生态来说，ClawKeeper 的出现是一个积极信号。一个开源项目的安全性，很大程度上取决于社区是否愿意正视问题并投入资源去解决。智源、北邮、信通院三家联合出手，至少说明学术界和标准制定机构已经把 OpenClaw 的安全问题当回事了。

但也要清醒地看到，ClawKeeper v1.0 还只是起点。智能体安全是一个攻防持续演进的领域，今天能防住的攻击模式，明天可能就被绕过。Watcher 机制的有效性需要在真实攻击场景中持续验证，三层架构之间的协调开销对性能的影响也需要更多的基准测试数据。

不过，有总比没有强。在 OpenClaw 默认配置几乎「裸奔」的现状下，ClawKeeper 至少给开发者提供了一个可以立即用起来的安全基线。

参考来源：

36氪 - 智源发布安全框架ClawKeeper，用智能体监管智能体 — 首发快讯
知乎专栏 - ClawKeeper：给OpenClaw智能体装上三层安全防火墙 — 技术架构详解

智源开源ClawKeeper：用智能体监管智能体

OpenClaw 到底有多危险？

ClawKeeper 的三层防御架构

第一层：Skill（技能层防御）

第二层：Plugin（插件层防御）

第三层：Watcher（观察者层防御）

跟同类方案比，ClawKeeper 的位置在哪？

对开发者意味着什么？

更大的背景

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们