谷歌停运 Project Mariner：技术并入 Gemini Agent 与 AI Mode

谷歌于 5 月 4 日正式关停实验项目 Project Mariner，其跨网页自动化能力已被拆解并入 Gemini Agent Mode、搜索 AI Mode 以及 Chrome 的 auto-browse。这是谷歌把 Agent 从实验室推向主线产品的标志性一步。

一个实验室项目的体面退场

5 月 4 日，谷歌在 Project Mariner 的官网上挂出了一张横幅："感谢你使用 Project Mariner，它已于 2026 年 5 月 4 日停运，其技术已航向谷歌的其他产品。"

措辞很谷歌——把一个项目的关停写成一次航行的延续。但圈内人心里都清楚，这不是 Bard 式的重命名，也不是 Duet AI 那种尴尬的消失，而是一次相当干净利落的收编：Mariner 这个名字没了，但它过去一年半里啃下来的硬骨头——让 AI 真正替你点开网页、填表单、比价、下单——已经被拆进了 Gemini Agent Mode、搜索里的 AI Mode，以及 Chrome 的 auto-browse。

如果你是做 Agent 应用的开发者，这件事比谷歌上周任何一个新模型发布都更值得关注。因为它回答了一个行业里悬了一年的问题：浏览器 Agent 到底该以什么形态存在？

Project Mariner 官网挂出的停运公告横幅

回顾：Mariner 这一年半干了什么

时间回到 2024 年 12 月。那会儿 OpenAI 的 Operator 还没正式发布，Anthropic 刚刚放出 Computer Use 的预览，Perplexity 也在测试自己的浏览器代理。谷歌选择用 Project Mariner 入场，定位是一个跑在 Chrome 里的实验性扩展，能替你执行跨网页的多步任务——典型场景是"帮我在这几个购物网站上比一下这款显卡的最低价"这种。

初版的 Mariner 有几个在当时挺前沿的设计决策：

直接操作 DOM 而非截图识别。和 Claude Computer Use 走的视觉点击路线不同，Mariner 更多依赖页面结构化信息，在表单、列表这类场景下稳定性明显更好，代价是对纯 Canvas 渲染的站点无能为力。
用户可接管。Agent 执行过程中，用户可以随时拿回鼠标，这在涉及支付、登录的环节近乎强制——这也是后来所有主流浏览器 Agent 的事实标准。
同时跑 10 个任务的并发能力，这个在 2025 年年中的更新里放出来，当时算是把"Agent 是不是只能串行"这个争论直接按住了。

但 Mariner 一直有个尴尬：它是个需要单独申请、单独安装的实验产品，用户量上不去，迭代反馈就稀。谷歌内部其实很早就想清楚了——这东西不该做成独立产品，它该是一种"能力"，渗透到用户已经在用的地方。

三个去向，拆得很清楚

看一下 Mariner 的能力最终被拆到哪里，就能理解谷歌的 Agent 产品图谱：

1. Gemini App 的 Agent Mode：消费级入口

Gemini 手机和网页端里的 Agent Mode，承接了 Mariner 里最"助理化"的那部分——帮你订酒店、归档一堆邮件、追踪一个包裹。这里的定位是个人事务助理，面向普通用户，强调"一句话说完需求，它自己去打开一堆标签页搞定"。

从今年 I/O 之后的几轮更新看，Agent Mode 已经能串联 Gmail、Calendar、Maps 这些第一方产品，加上 Mariner 过来的跨站点浏览能力，对于非技术用户来说，这几乎是目前体验门槛最低的 Agent 产品之一。

2. 搜索 AI Mode：改变"搜"这个动作

这个方向更有想象力，也更具侵略性。AI Mode 不是简单在搜索结果上加一层摘要，而是在用户问"帮我找一个这周五从北京飞东京、预算五千以内、最好直飞的航班"时，直接去各家航司和 OTA 网站上跑一遍，回来给你一个可下单的结果列表。

这事儿放在两年前是 Perplexity 和 Kayak 的活。现在谷歌用自己的搜索分发权把它内化了——这对下游 OTA、比价网站的流量生态冲击有多大，短期内很难评估，但方向上肯定不是好消息。

3. Chrome 的 auto-browse：浏览器原生 Agent

auto-browse 是今年早些时候谷歌在 Chrome 里演示过的功能，也吃了不少 Mariner 的技术底座。它和 Agent Mode 的区别在于：auto-browse 是跑在你当前浏览会话里的，你正在看机票，它可以接过去继续比价；而 Agent Mode 更像后台任务。

这是对 OpenAI Atlas 浏览器和 Perplexity Comet 最直接的回应——你不需要换一个浏览器才能用上 Agent，Chrome 本身就是。

Gemini Agent Mode、AI Mode 与 Chrome auto-browse 的产品形态对比

为什么是现在关停？

两个原因，一个是产品逻辑，一个是战略逻辑。

**产品上，Mariner 已经完成了它作为实验场的使命。**一个实验项目存在的价值，是用较低的用户承诺探索不确定的能力边界。当能力稳定了、场景验证过了，继续维护一个独立品牌反而是负担——既要做独立 UI、独立文档、独立运维，又要在每次模型升级时单独适配。谷歌过去两年被诟病最多的就是产品线混乱（Bard、Duet、Gemini、NotebookLM、Project Astra、Project Mariner……），这次算是主动做了减法。

**战略上，谷歌需要把 Agent 能力收到它控制的分发入口里。**搜索、Chrome、Gemini App，这是谷歌守了二十年的三个流量闸门。把 Mariner 拆进这三个地方，等于告诉市场：不要指望有一个独立的"谷歌 Agent 产品"让你订阅，Agent 就是未来搜索、未来浏览器、未来助理的一部分，它不收额外的钱，它就是服务本身。

这个打法和 OpenAI 不一样。OpenAI 的 Operator/Atlas 路线更强调"Agent 是一个新的产品品类"，是可以单独付费的；谷歌的路线是"Agent 是旧产品的新能力"，靠生态免费化来换用户黏性。两种路线谁对，得看接下来一年的数据。

开发者视角：能用上什么

对做应用的开发者，有几件事值得盯：

Gemini API 里的 computer-use / browser-use 相关接口在过去几个月已经陆续开放，Mariner 关停后，这些接口背后的能力会更统一、更稳定。之前那种"Mariner 效果最好但没 API，API 有但效果差一截"的割裂感应该会缓解。
A2A（Agent-to-Agent）协议是谷歌在 I/O 2025 推的开放协议，目标是让不同厂商的 Agent 能互相调用。Mariner 的关停意味着谷歌不再走"自家封闭 Agent"的路子，A2A 的推进力度会更大。
MCP 的原生支持已经在 Gemini API 和 SDK 里落地，做工具集成的成本比半年前低了不止一个量级。

如果你在开发里需要同时对比 Gemini、GPT、Claude 这几家在 Agent 任务上的表现——尤其是 Function Calling、长上下文工具调用这些具体场景——OpenAI Hub 目前把主流模型都接进来了，一个 Key 跑完三家，国内直连、OpenAI 格式兼容，省掉不少代理和账号层面的麻烦。

一个更大的判断

Mariner 的关停，某种意义上标志着"浏览器 Agent"作为一个独立品类的窗口期正在收窄。

过去一年，这个赛道里冒出来的产品不少：Operator、Atlas、Comet、Browser Use、Arc Search……它们的共同假设是，用户愿意为"会自己上网的 AI"单独买一个入口。但谷歌用 Mariner 的收编动作表达了另一种判断——这个能力太基础、太横向，迟早要被既有的浏览器、搜索、助理产品吸收掉，独立形态只是过渡。

这个判断不一定对。OpenAI 显然不这么想，否则不会专门做 Atlas 浏览器。但不可否认的是，当 Chrome 自带 auto-browse、搜索框里直接能跑 Agent 时，一个独立 Agent 产品要说服用户装新软件、换新习惯，门槛陡然变高。

对创业公司来说，这意味着在"通用浏览器 Agent"这条路上跟巨头硬刚基本没戏，机会在垂直领域——法律尽调、电商运营、金融信息整合这些场景里，通用 Agent 做不深，垂直 Agent 有自己的壁垒。

Mariner 的墓志铭写得挺漂亮："其技术已航向谷歌的其他产品。"实际上航向的是每一个谷歌用户每天都要打开的那几个页面。对谷歌来说，这才是它真正想要的结局。

参考来源

IT之家：谷歌停运 Project Mariner，跨网页自动化技术整合至 AI Mode — IT之家关于 Mariner 停运的中文首发报道，含项目时间线梳理
知乎专栏：这个 AI 智能体，比谷歌 I/O 大会更炸裂 — 对 Gemini Agent Mode 承接 Mariner 能力后的实际体验分析

Project Mariner 谢幕：谷歌把浏览器 Agent 拆进了 Gemini

一个实验室项目的体面退场

回顾：Mariner 这一年半干了什么

三个去向，拆得很清楚

1. Gemini App 的 Agent Mode：消费级入口

2. 搜索 AI Mode：改变"搜"这个动作

3. Chrome 的 auto-browse：浏览器原生 Agent

为什么是现在关停？

开发者视角：能用上什么

一个更大的判断

参考来源

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们