印度Emergent推出Wingman：WhatsApp里的AI Agent能替你干活了

印度vibe-coding明星创业公司Emergent正式进军AI Agent赛道，发布Wingman产品，让用户直接在WhatsApp和Telegram中通过自然语言对话管理和自动化日常任务，对标OpenClaw等主流Agent平台。

从写代码到替你干活，Emergent的野心变了

印度创业公司 Emergent 今天宣布推出 Wingman——一个可以直接跑在 WhatsApp 和 Telegram 里的 AI Agent 产品。用户不需要下载新 App，不需要学新界面，在聊天窗口里用自然语言说一句话，Wingman 就能帮你完成任务调度、信息查询、流程自动化等一系列操作。

Emergent 此前以 vibe-coding（氛围编程）工具起家，在印度开发者圈子里有不错的口碑。这次切入 AI Agent 领域，TechCrunch 将其定位为"OpenClaw-like"——也就是说，Emergent 瞄准的不是做一个聊天机器人，而是做一个能真正执行多步骤任务的智能代理。

这件事值得聊聊，因为它折射出 AI Agent 赛道正在发生的几个关键变化。

Wingman 到底能干什么

先说产品本身。

Wingman 的核心卖点是"把 AI Agent 塞进你已经在用的聊天工具里"。具体来说：

在 WhatsApp 或 Telegram 中直接与 Wingman 对话
通过自然语言下达指令，比如"帮我把下周一的会议改到周三下午三点"、"查一下上个月的销售数据汇总发给我"
Wingman 在后台拆解任务、调用外部工具和 API、执行操作、返回结果
支持多步骤任务编排，不只是一问一答

这个思路其实不新鲜。但 Emergent 选择 WhatsApp 和 Telegram 作为入口，在印度和东南亚市场有非常现实的意义——WhatsApp 在印度的月活超过 5 亿，Telegram 在技术社群中渗透率也很高。对于这些市场的用户来说，"打开 WhatsApp 就能用"比"去注册一个新平台"的转化率高出不止一个量级。

Wingman在WhatsApp聊天界面中执行多步骤任务的交互示意图

从技术架构上看，Wingman 本质上是一个标准的 LLM Agent 框架：大语言模型作为核心控制器，负责理解意图和规划任务；记忆模块维护上下文和用户偏好；工具模块对接日历、邮件、数据库、第三方 API 等外部服务。这套架构在 2023 年 AutoGPT 开源之后已经被验证过无数次，Emergent 的差异化不在架构本身，而在落地方式。

为什么是现在，为什么是印度

印度 AI 创业生态在过去一年发生了肉眼可见的变化。

一个大背景是：OpenAI 在今年 3 月刚刚任命了前 JioStar CEO Kiran Mani 负责亚洲扩张战略，印度被明确列为 OpenAI 全球第二大市场（按周活跃用户数计），每周有超过 1 亿 ChatGPT 用户。Tata Group 也已经和 OpenAI 达成合作，共建行业 AI 服务和数据中心。

这意味着什么？意味着印度市场的 AI 基础设施正在快速成熟，模型调用成本在下降，开发者生态在膨胀，用户对 AI 工具的接受度已经过了教育期。在这个时间点推出 Agent 产品，Emergent 踩的节奏是对的。

另一个值得注意的趋势是：全球 AI Agent 赛道正在从"技术 demo"阶段进入"产品化落地"阶段。2023 年到 2024 年，大家看到的 Agent 产品大多是"很酷但不太能用"——任务成功率不稳定，多步骤执行容易跑偏，成本也高。但到了 2025 年下半年和 2026 年，随着基座模型能力的提升（尤其是 function calling、tool use 能力的成熟），Agent 的可靠性有了质的飞跃。

Emergent 从 vibe-coding 切入 Agent，也有内在逻辑。vibe-coding 本身就是一种"用自然语言驱动代码生成"的范式，和 Agent 的"用自然语言驱动任务执行"在技术栈上高度重合。团队在 prompt engineering、任务拆解、工具调用这些核心能力上已经有积累，转型的技术门槛并不高。

对标 OpenClaw：Agent 赛道的竞争格局

TechCrunch 在报道中用了"OpenClaw-like"来形容 Wingman 的定位。OpenClaw 是目前 AI Agent 赛道的头部玩家之一，主打通用任务自动化，支持浏览器操作、API 调用、文件处理等多种能力。

但 Wingman 和 OpenClaw 的路线有明显区别：

| 维度 | OpenClaw | Wingman | |------|---------|--------| | 入口 | 独立平台/浏览器插件 | WhatsApp/Telegram | | 目标用户 | 开发者、技术用户 | 更广泛的普通用户 | | 核心场景 | 浏览器自动化、代码执行 | 日常任务管理、流程自动化 | | 市场重心 | 北美/欧洲 | 印度/东南亚 | | 交互方式 | Web UI + 命令行 | 聊天对话 |

这个差异很关键。OpenClaw 走的是"给技术人员一个万能工具"的路线，Wingman 走的是"让普通人在熟悉的环境里用上 Agent"的路线。两者不一定是直接竞争关系，更像是在不同市场、不同用户群体上的平行探索。

从商业角度看，Wingman 的路线可能更容易跑通 PMF（Product-Market Fit）。原因很简单：WhatsApp 是印度人的"超级入口"，在这个入口上叠加 Agent 能力，获客成本极低，用户学习成本也极低。相比之下，让用户去一个新平台注册、学习新的交互方式，在印度这样的市场摩擦太大。

但挑战也很明显。WhatsApp 和 Telegram 的 Bot API 在能力上有天花板——消息格式受限、交互模式单一、无法做复杂的 UI 渲染。如果 Wingman 想处理更复杂的任务（比如操作电子表格、生成可视化报告），纯聊天界面可能不够用。这是一个产品设计上的取舍。

Agent 落地的真正难题

说实话，AI Agent 这个赛道到今天，技术上的难题已经不是最大的瓶颈了。真正的难题在三个地方：

第一是可靠性。用户让 Agent 帮忙改个会议时间，如果十次里有三次改错了，用户就不会再用了。Agent 不像聊天机器人，聊天机器人说错一句话用户可以容忍，但 Agent 执行错一个操作可能造成实际损失。Wingman 在这方面需要证明自己。

第二是信任。让一个 AI 代理去操作你的日历、邮件、甚至支付，这需要极高的信任门槛。尤其在印度这样数据隐私意识正在快速觉醒的市场，Emergent 需要在数据安全和透明度上做足功课。

第三是生态。Agent 的价值取决于它能连接多少外部服务。如果 Wingman 只能做几个固定场景，那它就是一个高级聊天机器人；如果它能打通用户常用的几十个工具和服务，那它才是真正的 Agent。这需要大量的 API 集成工作和合作伙伴关系。

开发者视角：如何构建类似的 Agent

对于关注 Agent 开发的同学，Wingman 这类产品的技术实现并不神秘。核心链路就是：消息平台 Bot API → LLM 意图理解与任务规划 → 工具调用 → 结果返回。

如果你想快速搭建一个类似的原型，可以用 OpenAI 兼容格式的 API 来实现核心的意图理解和任务规划。以下是一个简化的示例，展示如何通过 LLM 实现 Agent 的任务拆解：

import openai

client = openai.OpenAI(
    api_key=\"your-api-key\",
    base_url=\"https://api.openai-hub.com/v1\"  # OpenAI Hub 聚合接口
)

# 定义可用工具
tools = [
    {
        \"type\": \"function\",
        \"function\": {
            \"name\": \"reschedule_meeting\",
            \"description\": \"重新安排会议时间\",
            \"parameters\": {
                \"type\": \"object\",
                \"properties\": {
                    \"meeting_id\": {\"type\": \"string\", \"description\": \"会议ID\"},
                    \"new_time\": {\"type\": \"string\", \"description\": \"新的时间，ISO 8601格式\"}
                },
                \"required\": [\"meeting_id\", \"new_time\"]
            }
        }
    },
    {
        \"type\": \"function\",
        \"function\": {
            \"name\": \"query_sales_data\",
            \"description\": \"查询销售数据汇总\",
            \"parameters\": {
                \"type\": \"object\",
                \"properties\": {
                    \"period\": {\"type\": \"string\", \"description\": \"查询周期，如 last_month\"},
                    \"format\": {\"type\": \"string\", \"description\": \"返回格式：summary 或 detailed\"}
                },
                \"required\": [\"period\"]
            }
        }
    }
]

# 模拟用户从 WhatsApp 发来的消息
user_message = \"帮我把明天下午的产品评审会改到周五上午十点，顺便查一下上个月的销售汇总\"

response = client.chat.completions.create(
    model=\"gpt-4o\",  # 通过 OpenAI Hub 可切换为 claude/gemini/deepseek 等
    messages=[
        {
            \"role\": \"system\",
            \"content\": \"你是一个任务执行助手。根据用户的自然语言指令，拆解任务并调用合适的工具。\"
        },
        {\"role\": \"user\", \"content\": user_message}
    ],
    tools=tools,
    tool_choice=\"auto\"
)

# Agent 会自动拆解为两个工具调用
for tool_call in response.choices[0].message.tool_calls:
    print(f\"调用工具: {tool_call.function.name}\")
    print(f\"参数: {tool_call.function.arguments}\")

这段代码展示的是 Agent 最核心的一环：LLM 理解用户意图后，自动拆解为多个工具调用。实际产品中，你还需要加上对话记忆管理、工具执行引擎、错误重试机制、以及和 WhatsApp Business API 的对接层。

通过 OpenAI Hub 这类聚合平台，开发者可以用同一套代码在 GPT-4o、Claude、Gemini、DeepSeek 等模型之间切换，方便在不同场景下选择性价比最优的模型——比如简单的意图识别用轻量模型降低成本，复杂的多步骤规划用旗舰模型保证质量。

更大的图景：Agent 的入口之争

Wingman 的发布，放在更大的行业背景下看，其实是 AI Agent 入口之争的一个缩影。

目前 Agent 产品的入口大致分几类：

独立 App/平台（如 OpenClaw、各类 Agent Builder）
浏览器插件（如各种 Browser Agent）
操作系统级集成（如 Apple Intelligence、Google Gemini on Android）
即时通讯平台（如 Wingman on WhatsApp/Telegram）
IDE 内嵌（如各类 Coding Agent）

每种入口都有自己的优势和局限。独立平台功能最强但获客最难，操作系统级集成覆盖最广但只有巨头能做，即时通讯平台获客最容易但交互能力受限。

Emergent 选择即时通讯作为入口，本质上是在赌一件事：对于大多数普通用户来说，Agent 的价值不在于它能做多复杂的事，而在于它能在你最自然的使用场景里帮你省事。你不需要打开一个专门的 Agent 平台，不需要学习新的操作方式，在你每天已经打开几十次的 WhatsApp 里，多发一条消息就行了。

这个赌注是否成立，取决于 Wingman 能不能在聊天界面的限制下，把任务执行的体验做到足够好。如果能，它可能在印度和东南亚市场跑出一个独特的增长曲线；如果不能，它就会沦为又一个"有趣但没人持续用"的 Bot。

对中国开发者的启示

最后说几句对国内开发者可能有用的观察。

Wingman 的思路——把 Agent 嵌入即时通讯——在国内其实有天然的土壤。微信的月活超过 13 亿，企业微信在 B 端渗透率极高，钉钉和飞书也都有成熟的 Bot 生态。如果有团队想做类似的事情，国内的基础设施条件其实比印度更好。

但国内的挑战也不同。微信对 Bot 的管控比 WhatsApp 严格得多，企业微信的 API 开放程度有限，而且国内用户对"在聊天里操作"这件事的预期已经被各种小程序拉得很高——你不能只是返回一段文字，用户会期待更丰富的交互。

从技术选型上看，Agent 开发最核心的能力——function calling 和 tool use——目前主流模型都已经支持得不错。GPT-4o、Claude 3.5/4、Gemini 2.5、DeepSeek-V3 在这方面各有优势。对于想快速验证 Agent 想法的开发者来说，用聚合 API 平台做原型是最高效的方式，不用为每个模型单独对接，也方便做 A/B 测试找到最适合自己场景的模型。

Emergent 的这一步，不管最终成败如何，至少说明了一件事：AI Agent 的战场正在从硅谷向全球扩散，而每个市场都会长出适合自己土壤的产品形态。印度有 WhatsApp，中国有微信，东南亚有 Line 和 Grab——Agent 的未来不会是一个统一的形态，而是千姿百态地嵌入每个地区用户最熟悉的数字生活里。

参考来源：

（注：本文核心信息来源于 TechCrunch 2026年4月15日报道《India's vibe-coding startup Emergent enters OpenClaw-like AI agent space》，因该域名国内访问受限，此处不附链接。其余补充背景信息来源于公开报道。）

Emergent推出Wingman：在WhatsApp里指挥AI干活

从写代码到替你干活，Emergent的野心变了

Wingman 到底能干什么

为什么是现在，为什么是印度

对标 OpenClaw：Agent 赛道的竞争格局

Agent 落地的真正难题

开发者视角：如何构建类似的 Agent

更大的图景：Agent 的入口之争

对中国开发者的启示

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们