从写代码到替你干活,Emergent的野心变了
印度创业公司 Emergent 今天宣布推出 Wingman——一个可以直接跑在 WhatsApp 和 Telegram 里的 AI Agent 产品。用户不需要下载新 App,不需要学新界面,在聊天窗口里用自然语言说一句话,Wingman 就能帮你完成任务调度、信息查询、流程自动化等一系列操作。
Emergent 此前以 vibe-coding(氛围编程)工具起家,在印度开发者圈子里有不错的口碑。这次切入 AI Agent 领域,TechCrunch 将其定位为"OpenClaw-like"——也就是说,Emergent 瞄准的不是做一个聊天机器人,而是做一个能真正执行多步骤任务的智能代理。
这件事值得聊聊,因为它折射出 AI Agent 赛道正在发生的几个关键变化。
Wingman 到底能干什么
先说产品本身。
Wingman 的核心卖点是"把 AI Agent 塞进你已经在用的聊天工具里"。具体来说:
- 在 WhatsApp 或 Telegram 中直接与 Wingman 对话
- 通过自然语言下达指令,比如"帮我把下周一的会议改到周三下午三点"、"查一下上个月的销售数据汇总发给我"
- Wingman 在后台拆解任务、调用外部工具和 API、执行操作、返回结果
- 支持多步骤任务编排,不只是一问一答
这个思路其实不新鲜。但 Emergent 选择 WhatsApp 和 Telegram 作为入口,在印度和东南亚市场有非常现实的意义——WhatsApp 在印度的月活超过 5 亿,Telegram 在技术社群中渗透率也很高。对于这些市场的用户来说,"打开 WhatsApp 就能用"比"去注册一个新平台"的转化率高出不止一个量级。

从技术架构上看,Wingman 本质上是一个标准的 LLM Agent 框架:大语言模型作为核心控制器,负责理解意图和规划任务;记忆模块维护上下文和用户偏好;工具模块对接日历、邮件、数据库、第三方 API 等外部服务。这套架构在 2023 年 AutoGPT 开源之后已经被验证过无数次,Emergent 的差异化不在架构本身,而在落地方式。
为什么是现在,为什么是印度
印度 AI 创业生态在过去一年发生了肉眼可见的变化。
一个大背景是:OpenAI 在今年 3 月刚刚任命了前 JioStar CEO Kiran Mani 负责亚洲扩张战略,印度被明确列为 OpenAI 全球第二大市场(按周活跃用户数计),每周有超过 1 亿 ChatGPT 用户。Tata Group 也已经和 OpenAI 达成合作,共建行业 AI 服务和数据中心。
这意味着什么?意味着印度市场的 AI 基础设施正在快速成熟,模型调用成本在下降,开发者生态在膨胀,用户对 AI 工具的接受度已经过了教育期。在这个时间点推出 Agent 产品,Emergent 踩的节奏是对的。
另一个值得注意的趋势是:全球 AI Agent 赛道正在从"技术 demo"阶段进入"产品化落地"阶段。2023 年到 2024 年,大家看到的 Agent 产品大多是"很酷但不太能用"——任务成功率不稳定,多步骤执行容易跑偏,成本也高。但到了 2025 年下半年和 2026 年,随着基座模型能力的提升(尤其是 function calling、tool use 能力的成熟),Agent 的可靠性有了质的飞跃。
Emergent 从 vibe-coding 切入 Agent,也有内在逻辑。vibe-coding 本身就是一种"用自然语言驱动代码生成"的范式,和 Agent 的"用自然语言驱动任务执行"在技术栈上高度重合。团队在 prompt engineering、任务拆解、工具调用这些核心能力上已经有积累,转型的技术门槛并不高。
对标 OpenClaw:Agent 赛道的竞争格局
TechCrunch 在报道中用了"OpenClaw-like"来形容 Wingman 的定位。OpenClaw 是目前 AI Agent 赛道的头部玩家之一,主打通用任务自动化,支持浏览器操作、API 调用、文件处理等多种能力。
但 Wingman 和 OpenClaw 的路线有明显区别:
| 维度 | OpenClaw | Wingman |
|---|---|---|
| 入口 | 独立平台/浏览器插件 | WhatsApp/Telegram |
| 目标用户 | 开发者、技术用户 | 更广泛的普通用户 |
| 核心场景 | 浏览器自动化、代码执行 | 日常任务管理、流程自动化 |
| 市场重心 | 北美/欧洲 | 印度/东南亚 |
| 交互方式 | Web UI + 命令行 | 聊天对话 |
这个差异很关键。OpenClaw 走的是"给技术人员一个万能工具"的路线,Wingman 走的是"让普通人在熟悉的环境里用上 Agent"的路线。两者不一定是直接竞争关系,更像是在不同市场、不同用户群体上的平行探索。
从商业角度看,Wingman 的路线可能更容易跑通 PMF(Product-Market Fit)。原因很简单:WhatsApp 是印度人的"超级入口",在这个入口上叠加 Agent 能力,获客成本极低,用户学习成本也极低。相比之下,让用户去一个新平台注册、学习新的交互方式,在印度这样的市场摩擦太大。
但挑战也很明显。WhatsApp 和 Telegram 的 Bot API 在能力上有天花板——消息格式受限、交互模式单一、无法做复杂的 UI 渲染。如果 Wingman 想处理更复杂的任务(比如操作电子表格、生成可视化报告),纯聊天界面可能不够用。这是一个产品设计上的取舍。
Agent 落地的真正难题
说实话,AI Agent 这个赛道到今天,技术上的难题已经不是最大的瓶颈了。真正的难题在三个地方:
第一是可靠性。用户让 Agent 帮忙改个会议时间,如果十次里有三次改错了,用户就不会再用了。Agent 不像聊天机器人,聊天机器人说错一句话用户可以容忍,但 Agent 执行错一个操作可能造成实际损失。Wingman 在这方面需要证明自己。
第二是信任。让一个 AI 代理去操作你的日历、邮件、甚至支付,这需要极高的信任门槛。尤其在印度这样数据隐私意识正在快速觉醒的市场,Emergent 需要在数据安全和透明度上做足功课。
第三是生态。Agent 的价值取决于它能连接多少外部服务。如果 Wingman 只能做几个固定场景,那它就是一个高级聊天机器人;如果它能打通用户常用的几十个工具和服务,那它才是真正的 Agent。这需要大量的 API 集成工作和合作伙伴关系。
开发者视角:如何构建类似的 Agent
对于关注 Agent 开发的同学,Wingman 这类产品的技术实现并不神秘。核心链路就是:消息平台 Bot API → LLM 意图理解与任务规划 → 工具调用 → 结果返回。
如果你想快速搭建一个类似的原型,可以用 OpenAI 兼容格式的 API 来实现核心的意图理解和任务规划。以下是一个简化的示例,展示如何通过 LLM 实现 Agent 的任务拆解:
import openai
client = openai.OpenAI(
api_key=\"your-api-key\",
base_url=\"https://api.openai-hub.com/v1\" # OpenAI Hub 聚合接口
)
# 定义可用工具
tools = [
{
\"type\": \"function\",
\"function\": {
\"name\": \"reschedule_meeting\",
\"description\": \"重新安排会议时间\",
\"parameters\": {
\"type\": \"object\",
\"properties\": {
\"meeting_id\": {\"type\": \"string\", \"description\": \"会议ID\"},
\"new_time\": {\"type\": \"string\", \"description\": \"新的时间,ISO 8601格式\"}
},
\"required\": [\"meeting_id\", \"new_time\"]
}
}
},
{
\"type\": \"function\",
\"function\": {
\"name\": \"query_sales_data\",
\"description\": \"查询销售数据汇总\",
\"parameters\": {
\"type\": \"object\",
\"properties\": {
\"period\": {\"type\": \"string\", \"description\": \"查询周期,如 last_month\"},
\"format\": {\"type\": \"string\", \"description\": \"返回格式:summary 或 detailed\"}
},
\"required\": [\"period\"]
}
}
}
]
# 模拟用户从 WhatsApp 发来的消息
user_message = \"帮我把明天下午的产品评审会改到周五上午十点,顺便查一下上个月的销售汇总\"
response = client.chat.completions.create(
model=\"gpt-4o\", # 通过 OpenAI Hub 可切换为 claude/gemini/deepseek 等
messages=[
{
\"role\": \"system\",
\"content\": \"你是一个任务执行助手。根据用户的自然语言指令,拆解任务并调用合适的工具。\"
},
{\"role\": \"user\", \"content\": user_message}
],
tools=tools,
tool_choice=\"auto\"
)
# Agent 会自动拆解为两个工具调用
for tool_call in response.choices[0].message.tool_calls:
print(f\"调用工具: {tool_call.function.name}\")
print(f\"参数: {tool_call.function.arguments}\")
这段代码展示的是 Agent 最核心的一环:LLM 理解用户意图后,自动拆解为多个工具调用。实际产品中,你还需要加上对话记忆管理、工具执行引擎、错误重试机制、以及和 WhatsApp Business API 的对接层。
通过 OpenAI Hub 这类聚合平台,开发者可以用同一套代码在 GPT-4o、Claude、Gemini、DeepSeek 等模型之间切换,方便在不同场景下选择性价比最优的模型——比如简单的意图识别用轻量模型降低成本,复杂的多步骤规划用旗舰模型保证质量。
更大的图景:Agent 的入口之争
Wingman 的发布,放在更大的行业背景下看,其实是 AI Agent 入口之争的一个缩影。
目前 Agent 产品的入口大致分几类:
- 独立 App/平台(如 OpenClaw、各类 Agent Builder)
- 浏览器插件(如各种 Browser Agent)
- 操作系统级集成(如 Apple Intelligence、Google Gemini on Android)
- 即时通讯平台(如 Wingman on WhatsApp/Telegram)
- IDE 内嵌(如各类 Coding Agent)
每种入口都有自己的优势和局限。独立平台功能最强但获客最难,操作系统级集成覆盖最广但只有巨头能做,即时通讯平台获客最容易但交互能力受限。
Emergent 选择即时通讯作为入口,本质上是在赌一件事:对于大多数普通用户来说,Agent 的价值不在于它能做多复杂的事,而在于它能在你最自然的使用场景里帮你省事。你不需要打开一个专门的 Agent 平台,不需要学习新的操作方式,在你每天已经打开几十次的 WhatsApp 里,多发一条消息就行了。
这个赌注是否成立,取决于 Wingman 能不能在聊天界面的限制下,把任务执行的体验做到足够好。如果能,它可能在印度和东南亚市场跑出一个独特的增长曲线;如果不能,它就会沦为又一个"有趣但没人持续用"的 Bot。
对中国开发者的启示
最后说几句对国内开发者可能有用的观察。
Wingman 的思路——把 Agent 嵌入即时通讯——在国内其实有天然的土壤。微信的月活超过 13 亿,企业微信在 B 端渗透率极高,钉钉和飞书也都有成熟的 Bot 生态。如果有团队想做类似的事情,国内的基础设施条件其实比印度更好。
但国内的挑战也不同。微信对 Bot 的管控比 WhatsApp 严格得多,企业微信的 API 开放程度有限,而且国内用户对"在聊天里操作"这件事的预期已经被各种小程序拉得很高——你不能只是返回一段文字,用户会期待更丰富的交互。
从技术选型上看,Agent 开发最核心的能力——function calling 和 tool use——目前主流模型都已经支持得不错。GPT-4o、Claude 3.5/4、Gemini 2.5、DeepSeek-V3 在这方面各有优势。对于想快速验证 Agent 想法的开发者来说,用聚合 API 平台做原型是最高效的方式,不用为每个模型单独对接,也方便做 A/B 测试找到最适合自己场景的模型。
Emergent 的这一步,不管最终成败如何,至少说明了一件事:AI Agent 的战场正在从硅谷向全球扩散,而每个市场都会长出适合自己土壤的产品形态。印度有 WhatsApp,中国有微信,东南亚有 Line 和 Grab——Agent 的未来不会是一个统一的形态,而是千姿百态地嵌入每个地区用户最熟悉的数字生活里。
参考来源:
(注:本文核心信息来源于 TechCrunch 2026年4月15日报道《India's vibe-coding startup Emergent enters OpenClaw-like AI agent space》,因该域名国内访问受限,此处不附链接。其余补充背景信息来源于公开报道。)