微软 CEO 纳德拉宣布将像管理员工一样管理内部 AI 智能体——给身份、给沙盒、给权限策略，并推出 Agent 365 工具套件。他自己同时跑 100 个编程智能体，已经被认知负荷压得够呛。

纳德拉要给微软的 AI 智能体"办工牌"了

微软 CEO 萨提亚·纳德拉今天放出一个信号：公司内部那一堆已经在跑的 AI 智能体，不能再这么"野生"下去了。要给它们发身份、划权限、建沙盒、做审计——基本上，按管员工的那一套来管。

据《商业内幕》6 月 6 日的报道，纳德拉说微软正在梳理工具和政策，目的是"监管内部创建的所有 AI 智能体"。具体怎么做？三句话：给身份、给沙盒、给治理策略。配套产品叫 Agent 365，里面打包了 Entra（数字身份与网络访问）和 Purview（数据标记与合规）。

这事听起来像是又一个企业管理工具发布会，但底下藏着一个更值得开发者注意的转变：智能体不再被当成"被使用的工具"，开始被当成"需要被治理的主体"。

微软 CEO 纳德拉在公司活动上发言，背景是 Agent 365 相关介绍

纳德拉自己被 100 个智能体围攻

先看一个挺有画面感的细节。纳德拉说他经常"同时运行 100 个 AI 编程智能体"，如果每一个都要他通过聊天界面去逐一指挥，"管理这些东西时承受的认知负荷非常高"。

这话从一个 CEO 嘴里说出来，分量不一样。它意味着两件事：

第一，微软高层确实在用这套东西，不是 PPT 工程。一个 CEO 跑 100 个并发 agent，已经完全不是"我跟一个聊天机器人对话"的范式，而是"我是一个项目经理，下面有一百个永不疲倦但也永不靠谱的初级工程师"。

第二，目前的人机交互形态根本扛不住这种规模。聊天窗口适合一对一，不适合一对多。Cursor、Claude Code、GitHub Copilot Workspace 这一拨工具今年都在往"任务面板 + 后台并发"的方向走，本质上就是在解决同一个问题——人脑没法同时盯 100 个对话框。

纳德拉最近那篇万字访谈里提过一句更直白的话：未来的 IDE 会变成一个融合电子表格、文档和消息流的"任务控制中心"，人不再是操作者，而是"拥有宏观委派能力的指挥官"。今天这个智能体治理框架，其实就是那个图景的安全底座。

Agent 365 在管什么

纳德拉的原话是："安全性、隔离性、可管理性和可观测性，是我们建立对这些 AI 智能体信心的方式。"

拆开看，Agent 365 想解决的是企业 IT 已经熟得不能再熟的四件事，只是把对象从"人"换成了"智能体"：

身份（Identity）：每个 agent 在 Entra 里有自己的账号，谁创建的、归哪个部门、调谁的 API，全部可追溯。这不是新概念——服务账号（service account）一直就是这么干的，但 agent 的特殊在于它会自己做决策、自己调工具，传统服务账号那种"开个权限就跑五年"的方式不够用。
权限边界（Scoping）：明确哪些数据能读、哪些不能读。这点对微软来说尤其敏感，因为 Microsoft 365 Graph 里堆着邮件、文档、Teams 通话——一个跨部门 agent 如果权限没切干净，分分钟把财务数据泄露到产品讨论里。
沙盒（Sandbox）：让 agent 在一个隔离环境里跑，错了不会污染生产数据。这部分在编程智能体场景里已经是标配，但在企业流程类 agent 里还很欠缺。
审计与数据标记（Purview）：agent 生成的内容会被打标，方便后续追责和合规审查。这个在受监管行业（金融、医疗、法律）几乎是必需品。

Agent 365 架构示意图，展示身份、权限、沙盒、审计四个层面

把 agent 当员工管，是聪明还是偷懒？

这套思路最有意思的地方是"借鉴管理员工的方式"。值得多问一句：这个类比成立吗？

成立的部分：身份、权限、审计这套 IAM（身份与访问管理）框架，过去几十年企业 IT 已经踩过的坑足够多，直接套上来确实省事。一个 agent 进入企业系统，必须有 principal、有 scope、有 log——这跟一个新员工入职拿工牌、配权限、留痕迹，结构上是一回事。

不成立的部分也得说清楚：

员工有自我克制，agent 没有。一个员工知道"这个文件夹我虽然有权限但不该看"，agent 在 prompt injection 面前会被一句话骗着到处翻。
员工的行为是低频、可预测的，agent 是高频、并发、随机的。一个 agent 一天可以调用上千次 API，传统审计系统的日志量和告警规则得整个重做。
员工出了事可以谈话、培训、解雇，agent 出了事只能下线、回滚、重训。问责链条完全不一样。

所以"像管员工一样管 agent"是个好用的入门类比，但落到产品里，Entra 和 Purview 必然要做大量 agent 专属的扩展。光把人类的 ACL 搬过去是不够的。

为什么是现在

企业级 AI 在过去一年砸了巨额预算，但 agent 怎么和员工协作，行业里基本还在摸索。Gartner 之前给过一个判断：到 2027 年大约 40% 的 agentic AI 项目会被取消，原因不是模型不行，而是治理跟不上、ROI 算不清。

微软选择在这个节点把治理工具产品化，时机很对。几个背景：

Copilot 已经在 Microsoft 365 里大规模铺开，企业 IT 的反馈集中在"权限范围对不准"、"机密文档被检索"、"输出无法溯源"这几件事上。Purview 这次把 agent 生成数据也纳入标记，是直接回应客户痛点。
Anthropic 的 MCP（Model Context Protocol）今年成了事实标准，agent 调用外部工具的接口越来越统一，但谁来调、能调什么、调用记录归谁——这层治理是空白。
多 agent 编排框架（AutoGen、LangGraph、CrewAI）爆发，开发者已经习惯让一组 agent 互相协作。可一旦进入企业内网，一个失控的子 agent 就能把整套权限模型撕开。

纳德拉这次更像是在给整个行业立一个参照标准：你要在企业里跑 agent，请按这四件事（身份、隔离、可管理、可观测）来。这套话术明显是冲着 CIO 和 CISO 去的——他们才是企业 AI 采购真正的把关人。

对开发者意味着什么

如果你在做 agent 类产品，几个方向需要尽早想清楚：

每个 agent 是不是都有独立身份？ 不要再用"一个 API key 走天下"的偷懒做法。哪怕是内部工具，至少给每个 agent 配一个可追溯的 principal。
权限是不是 scoped 的？ 让 agent 拿用户的全权令牌去调下游系统，是个非常常见的安全反模式。OAuth 2.1 + 细粒度 scope 是基础。
输出有没有打标？ agent 生成的内容、写入的数据库记录、发出的邮件，最好都带元数据标识来源。出了事能查，平时也能做评估。
审计日志是不是结构化的？ 自然语言日志看着热闹，但没法做异常检测。把 tool call、参数、结果都记成结构化事件，后面才好做安全监控。

这些其实都是老生常谈，只不过过去面向"服务"，现在面向"agent"。区别在于 agent 的不确定性更高，所以这层基础设施必须更厚。

一个判断

短期看，Agent 365 不会立刻让别的厂商跟进——AWS、Google Cloud 各有各的 IAM 体系，硬塞 agent 治理需要时间。但中期看，agent 治理大概率会从"安全功能"变成"基础设施层"，跟今天的 IAM、KMS、SIEM 一个量级。

微软这次的算盘也很清楚：模型层它不一定赢得了 OpenAI 和 Anthropic（虽然它都投了），但企业 IT 的盘子它已经守了二十多年，把 agent 治理塞进 Entra 和 Purview，等于把竞争维度从"谁的模型聪明"拉回到"谁能让 CIO 睡得着觉"。

这是一个对微软非常有利的战场。

顺便提一句，对于想在自己的 agent 系统里同时调用 GPT、Claude、Gemini、DeepSeek 等不同模型做对比和编排的开发者，OpenAI Hub 提供 OpenAI 兼容格式的统一接口，国内直连，一个 Key 切换不同模型，调试 multi-agent 工作流时省去不少 SDK 切换的麻烦。

参考来源

微软 CEO 纳德拉要把公司内部的智能体"管起来"，为其设定身份与权限边界 - IT之家 — IT之家关于 Agent 365 与纳德拉表态的原始报道。