Emergent推出Wingman:在WhatsApp里指挥AI干活

行业快讯

印度vibe-coding明星创业公司Emergent正式进军AI Agent赛道,发布Wingman产品,让用户直接在WhatsApp和Telegram中通过自然语言对话管理和自动化日常任务,对标OpenClaw等主流Agent平台。

从写代码到替你干活,Emergent的野心变了

印度创业公司 Emergent 今天宣布推出 Wingman——一个可以直接跑在 WhatsApp 和 Telegram 里的 AI Agent 产品。用户不需要下载新 App,不需要学新界面,在聊天窗口里用自然语言说一句话,Wingman 就能帮你完成任务调度、信息查询、流程自动化等一系列操作。

Emergent 此前以 vibe-coding(氛围编程)工具起家,在印度开发者圈子里有不错的口碑。这次切入 AI Agent 领域,TechCrunch 将其定位为"OpenClaw-like"——也就是说,Emergent 瞄准的不是做一个聊天机器人,而是做一个能真正执行多步骤任务的智能代理。

这件事值得聊聊,因为它折射出 AI Agent 赛道正在发生的几个关键变化。

Wingman 到底能干什么

先说产品本身。

Wingman 的核心卖点是"把 AI Agent 塞进你已经在用的聊天工具里"。具体来说:

  • 在 WhatsApp 或 Telegram 中直接与 Wingman 对话
  • 通过自然语言下达指令,比如"帮我把下周一的会议改到周三下午三点"、"查一下上个月的销售数据汇总发给我"
  • Wingman 在后台拆解任务、调用外部工具和 API、执行操作、返回结果
  • 支持多步骤任务编排,不只是一问一答

这个思路其实不新鲜。但 Emergent 选择 WhatsApp 和 Telegram 作为入口,在印度和东南亚市场有非常现实的意义——WhatsApp 在印度的月活超过 5 亿,Telegram 在技术社群中渗透率也很高。对于这些市场的用户来说,"打开 WhatsApp 就能用"比"去注册一个新平台"的转化率高出不止一个量级。

Wingman在WhatsApp聊天界面中执行多步骤任务的交互示意图

从技术架构上看,Wingman 本质上是一个标准的 LLM Agent 框架:大语言模型作为核心控制器,负责理解意图和规划任务;记忆模块维护上下文和用户偏好;工具模块对接日历、邮件、数据库、第三方 API 等外部服务。这套架构在 2023 年 AutoGPT 开源之后已经被验证过无数次,Emergent 的差异化不在架构本身,而在落地方式。

为什么是现在,为什么是印度

印度 AI 创业生态在过去一年发生了肉眼可见的变化。

一个大背景是:OpenAI 在今年 3 月刚刚任命了前 JioStar CEO Kiran Mani 负责亚洲扩张战略,印度被明确列为 OpenAI 全球第二大市场(按周活跃用户数计),每周有超过 1 亿 ChatGPT 用户。Tata Group 也已经和 OpenAI 达成合作,共建行业 AI 服务和数据中心。

这意味着什么?意味着印度市场的 AI 基础设施正在快速成熟,模型调用成本在下降,开发者生态在膨胀,用户对 AI 工具的接受度已经过了教育期。在这个时间点推出 Agent 产品,Emergent 踩的节奏是对的。

另一个值得注意的趋势是:全球 AI Agent 赛道正在从"技术 demo"阶段进入"产品化落地"阶段。2023 年到 2024 年,大家看到的 Agent 产品大多是"很酷但不太能用"——任务成功率不稳定,多步骤执行容易跑偏,成本也高。但到了 2025 年下半年和 2026 年,随着基座模型能力的提升(尤其是 function calling、tool use 能力的成熟),Agent 的可靠性有了质的飞跃。

Emergent 从 vibe-coding 切入 Agent,也有内在逻辑。vibe-coding 本身就是一种"用自然语言驱动代码生成"的范式,和 Agent 的"用自然语言驱动任务执行"在技术栈上高度重合。团队在 prompt engineering、任务拆解、工具调用这些核心能力上已经有积累,转型的技术门槛并不高。

对标 OpenClaw:Agent 赛道的竞争格局

TechCrunch 在报道中用了"OpenClaw-like"来形容 Wingman 的定位。OpenClaw 是目前 AI Agent 赛道的头部玩家之一,主打通用任务自动化,支持浏览器操作、API 调用、文件处理等多种能力。

但 Wingman 和 OpenClaw 的路线有明显区别:

维度 OpenClaw Wingman
入口 独立平台/浏览器插件 WhatsApp/Telegram
目标用户 开发者、技术用户 更广泛的普通用户
核心场景 浏览器自动化、代码执行 日常任务管理、流程自动化
市场重心 北美/欧洲 印度/东南亚
交互方式 Web UI + 命令行 聊天对话

这个差异很关键。OpenClaw 走的是"给技术人员一个万能工具"的路线,Wingman 走的是"让普通人在熟悉的环境里用上 Agent"的路线。两者不一定是直接竞争关系,更像是在不同市场、不同用户群体上的平行探索。

从商业角度看,Wingman 的路线可能更容易跑通 PMF(Product-Market Fit)。原因很简单:WhatsApp 是印度人的"超级入口",在这个入口上叠加 Agent 能力,获客成本极低,用户学习成本也极低。相比之下,让用户去一个新平台注册、学习新的交互方式,在印度这样的市场摩擦太大。

但挑战也很明显。WhatsApp 和 Telegram 的 Bot API 在能力上有天花板——消息格式受限、交互模式单一、无法做复杂的 UI 渲染。如果 Wingman 想处理更复杂的任务(比如操作电子表格、生成可视化报告),纯聊天界面可能不够用。这是一个产品设计上的取舍。

Agent 落地的真正难题

说实话,AI Agent 这个赛道到今天,技术上的难题已经不是最大的瓶颈了。真正的难题在三个地方:

第一是可靠性。用户让 Agent 帮忙改个会议时间,如果十次里有三次改错了,用户就不会再用了。Agent 不像聊天机器人,聊天机器人说错一句话用户可以容忍,但 Agent 执行错一个操作可能造成实际损失。Wingman 在这方面需要证明自己。

第二是信任。让一个 AI 代理去操作你的日历、邮件、甚至支付,这需要极高的信任门槛。尤其在印度这样数据隐私意识正在快速觉醒的市场,Emergent 需要在数据安全和透明度上做足功课。

第三是生态。Agent 的价值取决于它能连接多少外部服务。如果 Wingman 只能做几个固定场景,那它就是一个高级聊天机器人;如果它能打通用户常用的几十个工具和服务,那它才是真正的 Agent。这需要大量的 API 集成工作和合作伙伴关系。

开发者视角:如何构建类似的 Agent

对于关注 Agent 开发的同学,Wingman 这类产品的技术实现并不神秘。核心链路就是:消息平台 Bot API → LLM 意图理解与任务规划 → 工具调用 → 结果返回。

如果你想快速搭建一个类似的原型,可以用 OpenAI 兼容格式的 API 来实现核心的意图理解和任务规划。以下是一个简化的示例,展示如何通过 LLM 实现 Agent 的任务拆解:

import openai

client = openai.OpenAI(
    api_key=\"your-api-key\",
    base_url=\"https://api.openai-hub.com/v1\"  # OpenAI Hub 聚合接口
)

# 定义可用工具
tools = [
    {
        \"type\": \"function\",
        \"function\": {
            \"name\": \"reschedule_meeting\",
            \"description\": \"重新安排会议时间\",
            \"parameters\": {
                \"type\": \"object\",
                \"properties\": {
                    \"meeting_id\": {\"type\": \"string\", \"description\": \"会议ID\"},
                    \"new_time\": {\"type\": \"string\", \"description\": \"新的时间,ISO 8601格式\"}
                },
                \"required\": [\"meeting_id\", \"new_time\"]
            }
        }
    },
    {
        \"type\": \"function\",
        \"function\": {
            \"name\": \"query_sales_data\",
            \"description\": \"查询销售数据汇总\",
            \"parameters\": {
                \"type\": \"object\",
                \"properties\": {
                    \"period\": {\"type\": \"string\", \"description\": \"查询周期,如 last_month\"},
                    \"format\": {\"type\": \"string\", \"description\": \"返回格式:summary 或 detailed\"}
                },
                \"required\": [\"period\"]
            }
        }
    }
]

# 模拟用户从 WhatsApp 发来的消息
user_message = \"帮我把明天下午的产品评审会改到周五上午十点,顺便查一下上个月的销售汇总\"

response = client.chat.completions.create(
    model=\"gpt-4o\",  # 通过 OpenAI Hub 可切换为 claude/gemini/deepseek 等
    messages=[
        {
            \"role\": \"system\",
            \"content\": \"你是一个任务执行助手。根据用户的自然语言指令,拆解任务并调用合适的工具。\"
        },
        {\"role\": \"user\", \"content\": user_message}
    ],
    tools=tools,
    tool_choice=\"auto\"
)

# Agent 会自动拆解为两个工具调用
for tool_call in response.choices[0].message.tool_calls:
    print(f\"调用工具: {tool_call.function.name}\")
    print(f\"参数: {tool_call.function.arguments}\")

这段代码展示的是 Agent 最核心的一环:LLM 理解用户意图后,自动拆解为多个工具调用。实际产品中,你还需要加上对话记忆管理、工具执行引擎、错误重试机制、以及和 WhatsApp Business API 的对接层。

通过 OpenAI Hub 这类聚合平台,开发者可以用同一套代码在 GPT-4o、Claude、Gemini、DeepSeek 等模型之间切换,方便在不同场景下选择性价比最优的模型——比如简单的意图识别用轻量模型降低成本,复杂的多步骤规划用旗舰模型保证质量。

更大的图景:Agent 的入口之争

Wingman 的发布,放在更大的行业背景下看,其实是 AI Agent 入口之争的一个缩影。

目前 Agent 产品的入口大致分几类:

  • 独立 App/平台(如 OpenClaw、各类 Agent Builder)
  • 浏览器插件(如各种 Browser Agent)
  • 操作系统级集成(如 Apple Intelligence、Google Gemini on Android)
  • 即时通讯平台(如 Wingman on WhatsApp/Telegram)
  • IDE 内嵌(如各类 Coding Agent)

每种入口都有自己的优势和局限。独立平台功能最强但获客最难,操作系统级集成覆盖最广但只有巨头能做,即时通讯平台获客最容易但交互能力受限。

Emergent 选择即时通讯作为入口,本质上是在赌一件事:对于大多数普通用户来说,Agent 的价值不在于它能做多复杂的事,而在于它能在你最自然的使用场景里帮你省事。你不需要打开一个专门的 Agent 平台,不需要学习新的操作方式,在你每天已经打开几十次的 WhatsApp 里,多发一条消息就行了。

这个赌注是否成立,取决于 Wingman 能不能在聊天界面的限制下,把任务执行的体验做到足够好。如果能,它可能在印度和东南亚市场跑出一个独特的增长曲线;如果不能,它就会沦为又一个"有趣但没人持续用"的 Bot。

对中国开发者的启示

最后说几句对国内开发者可能有用的观察。

Wingman 的思路——把 Agent 嵌入即时通讯——在国内其实有天然的土壤。微信的月活超过 13 亿,企业微信在 B 端渗透率极高,钉钉和飞书也都有成熟的 Bot 生态。如果有团队想做类似的事情,国内的基础设施条件其实比印度更好。

但国内的挑战也不同。微信对 Bot 的管控比 WhatsApp 严格得多,企业微信的 API 开放程度有限,而且国内用户对"在聊天里操作"这件事的预期已经被各种小程序拉得很高——你不能只是返回一段文字,用户会期待更丰富的交互。

从技术选型上看,Agent 开发最核心的能力——function calling 和 tool use——目前主流模型都已经支持得不错。GPT-4o、Claude 3.5/4、Gemini 2.5、DeepSeek-V3 在这方面各有优势。对于想快速验证 Agent 想法的开发者来说,用聚合 API 平台做原型是最高效的方式,不用为每个模型单独对接,也方便做 A/B 测试找到最适合自己场景的模型。

Emergent 的这一步,不管最终成败如何,至少说明了一件事:AI Agent 的战场正在从硅谷向全球扩散,而每个市场都会长出适合自己土壤的产品形态。印度有 WhatsApp,中国有微信,东南亚有 Line 和 Grab——Agent 的未来不会是一个统一的形态,而是千姿百态地嵌入每个地区用户最熟悉的数字生活里。


参考来源:

(注:本文核心信息来源于 TechCrunch 2026年4月15日报道《India's vibe-coding startup Emergent enters OpenClaw-like AI agent space》,因该域名国内访问受限,此处不附链接。其余补充背景信息来源于公开报道。)