美团跑腿接入 AI Agent,自然语言下单压缩六步为一步
美团今天(5 月 26 日)发布了"跑腿 Skill",将跑腿下单能力以封装 Skill 形式向 AI 助手生态开放。这意味着用户无论使用 OpenClaw、Cursor、微信还是飞书里的 AI 助手,说一句"帮我去驿站取快递送到家",系统就能自动完成场景识别、地址匹配、价格预估和订单提交——原本需要打开 App、选地址、填物品、选配送类型、确认价格、提交订单的六步流程,被压缩成一句话。
这不是简单的语音输入替代手动填表,而是把结构化表单操作彻底解构成自然语言交互。美团在做的事情,是让 AI Agent 真正能"做事",而不只是"说话"。

从六步到一步,AI 在背后做了什么
传统的跑腿下单流程是典型的多步表单操作:打开 App → 选择取件地址 → 选择送达地址 → 填写物品信息 → 选择配送类型 → 确认价格 → 提交订单。每一步都需要用户在结构化界面里点选或输入,中间任何一步卡住都得重来。
美团跑腿 Skill 把这个流程重构了。用户只需要用日常语言说清需求,比如"帮我到菜市场买 1 斤新鲜田螺",AI 在背后会做这些事:
- 场景识别:判断这是"帮买"场景,不是"帮送"或"帮取"
- 地址解析:从用户的地址簿里匹配"菜市场"和默认收货地址,如果匹配不到就调用 POI 搜索
- 物品理解:识别"1 斤新鲜田螺"属于生鲜品类,自动填充物品信息
- 价格预估:根据距离、物品重量、时段计算配送费
- 订单预览:生成完整的订单卡片,包含取件地址、送达地址、物品、配送费、预计送达时间
- 等待确认:用户说"确认"后才提交订单,没有静默下单
整个过程用户只需要说两句话:第一句描述需求,第二句确认订单。中间的所有结构化操作都由 AI 和 Skill 协同完成。
零开发接入,兼容所有 Claw 客户端
美团跑腿 Skill 采用零开发接入方式,代码已在 GitHub 开源。支持 OpenClaw 本地版、火山引擎等云部署版、Qclaw 等第三方客户端。安装方式有两种:
- 把 GitHub 链接直接发给 AI 助手,说"帮我安装这个 Skill",它会自动完成安装
- 下载 zip 包,发给 AI 助手,说"帮我安装这个 Skill"
首次使用会跳转美团 App 完成授权,之后无需重复操作。这个设计很克制:美团没有要求用户在 AI 助手里完成支付,而是把支付环节留在自己的 App 里。高额订单还会额外确认,防止 LLM 理解偏差或误触导致的错误下单。
这种克制背后是对 AI Agent 生态的理解。美团知道自己在做什么:不是把美团 App 搬到 AI 助手里,而是把跑腿下单能力开放给 AI 助手生态。用户在哪里,服务就在哪里。
地址簿、POI 搜索、订单查询,细节决定体验
美团跑腿 Skill 在技术实现上有几个值得关注的细节:
智能地址匹配
登录后自动拉取美团地址簿,优先进行模糊匹配。用户说"帮我去公司楼下取快递",AI 会先在地址簿里找"公司"这个标签,匹配到就直接用,匹配不到再调用 POI 搜索。这个设计避免了每次都要重新输入地址的麻烦,对高频用户尤其友好。
物品信息自动识别
用户说"帮我买一杯瑞幸咖啡",AI 会自动识别这是饮品品类,填充到物品信息里。用户不需要在下拉菜单里手动选择"食品饮料 → 饮品 → 咖啡"。这个能力依赖 LLM 的语义理解,但美团在 Skill 层做了品类映射,确保识别结果能正确对应到美团跑腿的物品分类体系。
订单状态实时查询
下单后,用户可以直接问 AI 助手"骑手到了吗",Skill 会调用美团跑腿的订单状态接口,返回实时配送进度。用户不需要切换到美团 App 查看,整个流程在 AI 助手里闭环。
这些细节看起来不起眼,但每一个都在解决真实场景里的摩擦点。美团做过外卖、做过打车、做过买菜,知道用户在什么地方会卡住,知道什么样的交互是顺滑的。
AI Agent 生态的入场券:Skill 标准化
美团跑腿 Skill 的发布,背后是 AI Agent 生态的快速兴起。过去一年,OpenClaw、Cursor、微信、飞书等平台都在构建自己的 AI 助手能力,用户发起需求的入口不再局限于单一 App,而是分散在各个 AI 助手里。
对服务提供方来说,这是机会也是挑战。机会在于触达用户的入口变多了,挑战在于如何让服务能力在不同 AI 助手里都能被调用。美团的答案是 Skill 标准化:把跑腿下单能力封装成一个标准 Skill,任何兼容 Claw 协议的 AI 助手都能接入。
这个思路和移动互联网时代的 SDK 封装类似,但更进一步。SDK 是把能力封装给开发者,Skill 是把能力封装给 AI。开发者需要写代码调用 SDK,AI 只需要理解 Skill 的定义就能调用。这意味着服务提供方不需要为每个 AI 助手单独开发集成方案,AI 助手也不需要为每个服务单独写适配代码。
美团不是第一个做 Skill 的,但美团跑腿 Skill 的完成度很高。从场景识别、地址匹配、价格预估到订单提交、状态查询,整个链路都打通了。这不是 Demo,是能真正跑起来的生产级服务。
高频用户和非标需求,两个被低估的场景
美团在发布文章里提到了两个场景:高频用户和非标需求。
对高频用户来说,跑腿 Skill 的价值在于提效。商家、代购、个人助理这些角色每天要下几十单甚至上百单,传统方式需要逐一手动输入地址、物品、备注。有了 Skill,直接口述需求就能完成从下单到支付的全流程,尤其是在订单高峰期,能显著减少操作时间。
对非标需求来说,跑腿 Skill 的价值在于降低门槛。很多用户不知道跑腿服务能做什么、不能做什么,看到表单就放弃了。AI 可以主动引导可行方案,比如用户说"帮我去医院拿药",AI 会提示"需要提供处方单照片,骑手会帮你取药送到家"。这种引导式交互比静态的帮助文档更有效。
这两个场景看起来是两个极端——一个是重度用户,一个是轻度用户——但本质上都在解决同一个问题:降低服务使用的摩擦。高频用户的摩擦在于重复操作,轻度用户的摩擦在于认知门槛。AI 能同时解决这两个问题。
从"教 AI 说话"到"教 AI 做事"
美团在发布文章的结尾写了一句话:"过去三年,我们在教 AI 说话。现在,我们在教 AI 做事。"
这句话说得很准。过去几年,大家都在做对话式 AI,让 AI 能听懂人话、能回答问题、能闲聊。但对话只是手段,不是目的。用户要的不是和 AI 聊天,而是让 AI 帮自己完成任务。
美团跑腿 Skill 是"教 AI 做事"的一个样本。它不是简单的语音助手,不是把文字转成语音再转回文字,而是让 AI 真正理解用户意图,调用真实的服务能力,完成真实的业务流程。
这个方向上,美团不是唯一的玩家。OpenAI 的 GPTs、Anthropic 的 Claude Tools、Google 的 Gemini Extensions,都在做类似的事情。但美团的优势在于它有真实的服务场景、有海量的订单数据、有成熟的履约体系。这些是做 Skill 的基础设施。
风险和边界
美团在 Skill 的免责声明里写得很清楚:"本 Skill 运行在用户自行选择的独立 AI 助手环境中,由用户自行选择的大模型驱动。美团仅提供跑腿相关接口和 Skill 定义,不对 AI 助手的运行环境、大模型安全合规性承担任何责任。"
这段话透露了两个信息:
- 责任边界:美团只负责 Skill 本身的功能和接口,不负责 AI 助手的行为。如果 LLM 理解错了用户意图,下错了单,这不是美团的问题。
- 安全门控:美团在 Skill 层做了多重保护——订单预览、用户确认、高额订单二次确认、支付在 App 内完成——来降低 LLM 理解偏差带来的风险。
这是一个务实的做法。AI Agent 生态还在早期,LLM 的可靠性还没到能完全自主决策的程度。美团选择在关键环节保留人工确认,而不是追求完全自动化。这种克制是对的。
另一个值得关注的点是数据安全。用户的地址、订单、支付信息都在美团体系内流转,不会暴露给 AI 助手。AI 助手只能通过 Skill 定义的接口调用服务,看不到底层数据。这个设计保护了用户隐私,也保护了美团的数据资产。
这只是开始
美团跑腿 Skill 是美团在 AI Agent 生态的第一步,但不会是最后一步。外卖、打车、酒旅、买菜,美团的每个业务线都有可能以 Skill 形式开放给 AI 助手生态。
想象一下:你对 AI 助手说"明天中午订一份工作餐,晚上帮我叫个车去机场,顺便订一家机场附近的酒店",AI 自动调用美团外卖 Skill、美团打车 Skill、美团酒旅 Skill,完成三个订单。整个过程你只需要说一句话,确认三次。
这不是科幻,是接下来一两年会发生的事情。AI Agent 生态的核心不是 LLM 有多聪明,而是有多少真实的服务能力能被 AI 调用。美团有服务,有场景,有数据,有履约能力。这些是做 AI Agent 生态的硬通货。
跑腿 Skill 只是一个开始。美团在赌 AI Agent 会成为下一个流量入口,在赌用户会习惯用自然语言完成所有任务。这个赌注不小,但美团有资格下注。
参考来源
美团推出"跑腿 Skill",可对接各大 AI 助手实现"一句话点单" - IT之家
美团官方发布跑腿 Skill 的详细功能介绍和使用说明美团跑腿 Skill:一句话,骑手来帮忙 - 稀土掘金
美团技术团队发布的 Skill 技术实现细节和安装指南美团跑腿 Skill - GitHub
美团跑腿 Skill 开源代码仓库