Project Mariner 谢幕:谷歌把浏览器 Agent 拆进了 Gemini

谷歌于 5 月 4 日正式关停实验项目 Project Mariner,其跨网页自动化能力已被拆解并入 Gemini Agent Mode、搜索 AI Mode 以及 Chrome 的 auto-browse。这是谷歌把 Agent 从实验室推向主线产品的标志性一步。
一个实验室项目的体面退场
5 月 4 日,谷歌在 Project Mariner 的官网上挂出了一张横幅:"感谢你使用 Project Mariner,它已于 2026 年 5 月 4 日停运,其技术已航向谷歌的其他产品。"
措辞很谷歌——把一个项目的关停写成一次航行的延续。但圈内人心里都清楚,这不是 Bard 式的重命名,也不是 Duet AI 那种尴尬的消失,而是一次相当干净利落的收编:Mariner 这个名字没了,但它过去一年半里啃下来的硬骨头——让 AI 真正替你点开网页、填表单、比价、下单——已经被拆进了 Gemini Agent Mode、搜索里的 AI Mode,以及 Chrome 的 auto-browse。
如果你是做 Agent 应用的开发者,这件事比谷歌上周任何一个新模型发布都更值得关注。因为它回答了一个行业里悬了一年的问题:浏览器 Agent 到底该以什么形态存在?

回顾:Mariner 这一年半干了什么
时间回到 2024 年 12 月。那会儿 OpenAI 的 Operator 还没正式发布,Anthropic 刚刚放出 Computer Use 的预览,Perplexity 也在测试自己的浏览器代理。谷歌选择用 Project Mariner 入场,定位是一个跑在 Chrome 里的实验性扩展,能替你执行跨网页的多步任务——典型场景是"帮我在这几个购物网站上比一下这款显卡的最低价"这种。
初版的 Mariner 有几个在当时挺前沿的设计决策:
- 直接操作 DOM 而非截图识别。和 Claude Computer Use 走的视觉点击路线不同,Mariner 更多依赖页面结构化信息,在表单、列表这类场景下稳定性明显更好,代价是对纯 Canvas 渲染的站点无能为力。
- 用户可接管。Agent 执行过程中,用户可以随时拿回鼠标,这在涉及支付、登录的环节近乎强制——这也是后来所有主流浏览器 Agent 的事实标准。
- 同时跑 10 个任务的并发能力,这个在 2025 年年中的更新里放出来,当时算是把"Agent 是不是只能串行"这个争论直接按住了。
但 Mariner 一直有个尴尬:它是个需要单独申请、单独安装的实验产品,用户量上不去,迭代反馈就稀。谷歌内部其实很早就想清楚了——这东西不该做成独立产品,它该是一种"能力",渗透到用户已经在用的地方。
三个去向,拆得很清楚
看一下 Mariner 的能力最终被拆到哪里,就能理解谷歌的 Agent 产品图谱:
1. Gemini App 的 Agent Mode:消费级入口
Gemini 手机和网页端里的 Agent Mode,承接了 Mariner 里最"助理化"的那部分——帮你订酒店、归档一堆邮件、追踪一个包裹。这里的定位是个人事务助理,面向普通用户,强调"一句话说完需求,它自己去打开一堆标签页搞定"。
从今年 I/O 之后的几轮更新看,Agent Mode 已经能串联 Gmail、Calendar、Maps 这些第一方产品,加上 Mariner 过来的跨站点浏览能力,对于非技术用户来说,这几乎是目前体验门槛最低的 Agent 产品之一。
2. 搜索 AI Mode:改变"搜"这个动作
这个方向更有想象力,也更具侵略性。AI Mode 不是简单在搜索结果上加一层摘要,而是在用户问"帮我找一个这周五从北京飞东京、预算五千以内、最好直飞的航班"时,直接去各家航司和 OTA 网站上跑一遍,回来给你一个可下单的结果列表。
这事儿放在两年前是 Perplexity 和 Kayak 的活。现在谷歌用自己的搜索分发权把它内化了——这对下游 OTA、比价网站的流量生态冲击有多大,短期内很难评估,但方向上肯定不是好消息。
3. Chrome 的 auto-browse:浏览器原生 Agent
auto-browse 是今年早些时候谷歌在 Chrome 里演示过的功能,也吃了不少 Mariner 的技术底座。它和 Agent Mode 的区别在于:auto-browse 是跑在你当前浏览会话里的,你正在看机票,它可以接过去继续比价;而 Agent Mode 更像后台任务。
这是对 OpenAI Atlas 浏览器和 Perplexity Comet 最直接的回应——你不需要换一个浏览器才能用上 Agent,Chrome 本身就是。

为什么是现在关停?
两个原因,一个是产品逻辑,一个是战略逻辑。
**产品上,Mariner 已经完成了它作为实验场的使命。**一个实验项目存在的价值,是用较低的用户承诺探索不确定的能力边界。当能力稳定了、场景验证过了,继续维护一个独立品牌反而是负担——既要做独立 UI、独立文档、独立运维,又要在每次模型升级时单独适配。谷歌过去两年被诟病最多的就是产品线混乱(Bard、Duet、Gemini、NotebookLM、Project Astra、Project Mariner……),这次算是主动做了减法。
**战略上,谷歌需要把 Agent 能力收到它控制的分发入口里。**搜索、Chrome、Gemini App,这是谷歌守了二十年的三个流量闸门。把 Mariner 拆进这三个地方,等于告诉市场:不要指望有一个独立的"谷歌 Agent 产品"让你订阅,Agent 就是未来搜索、未来浏览器、未来助理的一部分,它不收额外的钱,它就是服务本身。
这个打法和 OpenAI 不一样。OpenAI 的 Operator/Atlas 路线更强调"Agent 是一个新的产品品类",是可以单独付费的;谷歌的路线是"Agent 是旧产品的新能力",靠生态免费化来换用户黏性。两种路线谁对,得看接下来一年的数据。
开发者视角:能用上什么
对做应用的开发者,有几件事值得盯:
- Gemini API 里的 computer-use / browser-use 相关接口在过去几个月已经陆续开放,Mariner 关停后,这些接口背后的能力会更统一、更稳定。之前那种"Mariner 效果最好但没 API,API 有但效果差一截"的割裂感应该会缓解。
- A2A(Agent-to-Agent)协议是谷歌在 I/O 2025 推的开放协议,目标是让不同厂商的 Agent 能互相调用。Mariner 的关停意味着谷歌不再走"自家封闭 Agent"的路子,A2A 的推进力度会更大。
- MCP 的原生支持已经在 Gemini API 和 SDK 里落地,做工具集成的成本比半年前低了不止一个量级。
如果你在开发里需要同时对比 Gemini、GPT、Claude 这几家在 Agent 任务上的表现——尤其是 Function Calling、长上下文工具调用这些具体场景——OpenAI Hub 目前把主流模型都接进来了,一个 Key 跑完三家,国内直连、OpenAI 格式兼容,省掉不少代理和账号层面的麻烦。
一个更大的判断
Mariner 的关停,某种意义上标志着"浏览器 Agent"作为一个独立品类的窗口期正在收窄。
过去一年,这个赛道里冒出来的产品不少:Operator、Atlas、Comet、Browser Use、Arc Search……它们的共同假设是,用户愿意为"会自己上网的 AI"单独买一个入口。但谷歌用 Mariner 的收编动作表达了另一种判断——这个能力太基础、太横向,迟早要被既有的浏览器、搜索、助理产品吸收掉,独立形态只是过渡。
这个判断不一定对。OpenAI 显然不这么想,否则不会专门做 Atlas 浏览器。但不可否认的是,当 Chrome 自带 auto-browse、搜索框里直接能跑 Agent 时,一个独立 Agent 产品要说服用户装新软件、换新习惯,门槛陡然变高。
对创业公司来说,这意味着在"通用浏览器 Agent"这条路上跟巨头硬刚基本没戏,机会在垂直领域——法律尽调、电商运营、金融信息整合这些场景里,通用 Agent 做不深,垂直 Agent 有自己的壁垒。
Mariner 的墓志铭写得挺漂亮:"其技术已航向谷歌的其他产品。"实际上航向的是每一个谷歌用户每天都要打开的那几个页面。对谷歌来说,这才是它真正想要的结局。
参考来源
- IT之家:谷歌停运 Project Mariner,跨网页自动化技术整合至 AI Mode — IT之家关于 Mariner 停运的中文首发报道,含项目时间线梳理
- 知乎专栏:这个 AI 智能体,比谷歌 I/O 大会更炸裂 — 对 Gemini Agent Mode 承接 Mariner 能力后的实际体验分析



