AI 快讯Transformer之父二次出走:Noam Shazeer离开谷歌投奔OpenAI
行业快讯

Transformer之父二次出走:Noam Shazeer离开谷歌投奔OpenAI

2026-06-18T05:05:06.713Z

Gemini联合负责人、Transformer论文作者Noam Shazeer宣布离开谷歌加入OpenAI。这是他职业生涯中第二次告别这家自2000年就效力的公司,距离他被谷歌花25亿美元"买回来"还不到两年。

Transformer八作者之一,再次走出谷歌大门

Noam Shazeer 又一次离开了谷歌。

本周二,这位 Gemini 的联合负责人、工程副总裁在 X 上发了一条不长的帖子,宣布将加入 OpenAI。他没说具体职位,只是写了一句"这是个艰难的决定"。但圈内人都明白,这条不到 200 字的公告分量有多重——它意味着 Transformer 论文八位作者中,最后一位还留在谷歌"主力位置"上的核心人物,也走了。

而距离谷歌花大约 25 亿美元把他从 Character.AI 接回来,掐指算来,还不到两年。

从首席工程师到"叛将",再到 Gemini 一号位

要理解这次离职的冲击力,得先回顾 Shazeer 在谷歌的轨迹。

2000 年底,刚毕业不久的 Shazeer 加入谷歌,做的是早期广告系统。那是个谷歌还没上市的年代,他是公司最早的一批核心工程师之一,后来一路做到首席软件工程师。在内部,他长期扮演的是"那个最懂模型怎么写代码的人"——2017 年 Transformer 横空出世,《Attention is All You Need》八位署名作者里,Shazeer 是把整个项目代码重写了一遍、把性能拉到新高度的人。这一笔,足以让他在 AI 史上留名。

2021 年底,Shazeer 第一次离开。原因外界传得很直白:受不了谷歌的官僚主义。他带着另一位 LaMDA 团队的同事 Daniel De Freitas 出来创办了 Character.AI,做拟人化对话产品,一度月活突破 2000 万,估值十亿美金。

然后是 2024 年 8 月的那场"反向收购"。谷歌通过一项约 25 亿美元的非独家技术授权协议,把 Character.AI 的核心团队(包括两位创始人)重新收编回来。Shazeer 没有去 DeepMind 也没去 Google Research,而是直接被任命为 Gemini 的联合技术负责人,跟 Jeff Dean、Oriol Vinyals 平起平坐。换句话说,他回来之后立刻拿到的是 Gemini 一号位的卡——这在谷歌内部组织架构里几乎是史无前例的安排。

现在不到两年时间,他又走了。

为什么是现在?三个信号叠加

Shazeer 自己没说理由,但把时间线对一下,几个信号叠在一起就比较清楚了。

第一,Gemini 在过去半年里换挡明显。 谷歌的 Gemini 3 系列发布之后,团队组织架构经历了一轮调整。一个一直被外界讨论的问题是:Hassabis、Jeff Dean、Vinyals、Shazeer 这种"多头并列"的格局到底能撑多久。从结果上看,撑不住。AI 内部权力的天平在最近一年明显向 DeepMind 那一侧倾斜,留给 Shazeer 这种"产品+架构"双栖型选手的自由度其实在收窄。

第二,OpenAI 这边的招人节奏在加快。 从去年下半年开始,OpenAI 就在挖谷歌系的核心研究员,Amelia Glaese 等人就是典型。这一波招聘的目标很明确:补齐多模态、长上下文和强化学习方向上的顶级架构师。Shazeer 是少数同时具备"提出新架构"和"把架构跑通到产品级"两种能力的人,对 OpenAI 的吸引力不用解释。

第三,他的个人风格本来就不适合大公司。 这一点他自己 2021 年用脚投过票。Character.AI 时期他也是亲自下场写代码、做 infra。Gemini 这种几千人协作的项目,决策链上下要过太多人,对他来说大概率是消耗。

这三件事叠在一起,离开几乎是早晚。

这对谷歌意味着什么

短期内,Gemini 项目不会因为一个人走人崩盘。Jeff Dean 还在,Vinyals 还在,Gemini 团队的工程能力依旧是行业第一梯队。

但中长期看,谷歌损失的不只是一个工程副总裁。

  • 架构话语权的流失。Shazeer 是那种"能从头写一个 Attention 变体"的人,过去两年 Gemini 在 MoE、长上下文、稀疏化方面的几次关键决策都跟他有关。换个角度说,他走了之后,谷歌内部还能在架构层和 OpenAI/Anthropic 正面掰手腕的人,明显少了一位。
  • 人才信号问题。过去一年从谷歌流向 OpenAI 和 Anthropic 的研究员,数量不算少。Shazeer 这种级别的离开,会进一步强化"OpenAI 才是研究人最自由的地方"这种叙事——而这种叙事一旦在湾区扩散开,对招聘的影响是非常实际的。
  • 25 亿美元买回来的人,不到两年又走了。这笔账不是钱的问题,而是说明谷歌对这种顶级人才的留存机制存在结构性的问题。竞业、股权、职位都给到了天花板,仍然留不住。

谷歌内部对此的反应据说也很冷静。一位接近 Gemini 团队的人说,"大家不意外,只是觉得来得稍微早了一点。"

对 OpenAI 来说是什么棋

OpenAI 没有透露 Shazeer 的具体角色。但从他的能力画像反推,大概率是研究侧的高级岗位,可能直接向 Greg Brockman 或者 Mark Chen 汇报。

OpenAI 在过去半年里做了两件事:一是推 GPT-5 的后续版本和 o 系列推理模型的迭代,二是在内部重启了一些更底层的架构探索项目。后者正是 Shazeer 擅长的方向。

值得注意的还有一层:Shazeer 在 Character.AI 时期积累的"模型即产品"的经验,是 OpenAI 当前 ChatGPT 产品化路径上欠缺的一块。ChatGPT 的工程能力已经很强,但在"如何让模型自己成为一个能让用户上瘾的产品"这件事上,Character.AI 留下的那套方法论 OpenAI 并不熟。如果 Shazeer 在 OpenAI 兼顾研究和产品,影响面会比单纯做研究大不少。

当然也有变数。Shazeer 是那种典型的"研究员气质创业者",会不会在 OpenAI 这种已经 3000 人规模的公司里再次感到不自由,谁也说不准。两年前他能从 Character.AI 回到谷歌,两年后他从谷歌再去 OpenAI——下一站会不会是再出去单干,并不能完全排除。

一组被忽略的细节

几条值得注意但媒体没怎么提的细节:

  1. Shazeer 这次离职没有出现常见的"长达数月的过渡期"安排。从公告时间看,他切换得相当干脆。
  2. Character.AI 的另一位联合创始人 Daniel De Freitas 目前没有公开离职消息,但据多个信源,他在 Gemini 多模态组的角色已经从年初开始弱化。
  3. 谷歌和 Shazeer 之间那份 2024 年签的授权协议是非独家的,意味着 Character.AI 的技术其他厂商理论上也能拿到许可——这条款当时被解读为反垄断防御,但放在今天看,它意外地降低了 Shazeer 的"绑定成本"。

这三条放一起,说明这次离开不是一次冲动,而是一次有准备的退出。

行业格局的微调

把视角拉远一点。从 2023 年到现在,AI 顶级研究员的迁徙路径基本上是这样的:

  • Google → OpenAI / Anthropic:单向流出为主,Shazeer 是最新一个标志性案例。
  • OpenAI → Anthropic / 自创业:双向都有,但创业为主。
  • Meta → ?:Meta 内部经历了 Llama 团队的几次拆分,部分核心成员流向了创业公司。

这条迁徙图的核心结论是:架构创新的中心正在从谷歌进一步偏移。谷歌依然有最强的算力、最强的 infra、最完整的数据闭环,但在"下一代架构由谁来定义"这件事上,话语权正在松动。

Gemini 3 之后下一代模型的赛跑,会因为这次人员变动变得更胶着。OpenAI 拿到 Shazeer 之后,不出意外的话,会在年底前后给出一些架构上的新动作。

一点延伸

说点跟开发者直接相关的。Gemini 系列、GPT 系列、Claude 系列这一轮的对位竞争,对应用层开发者来说其实是好事——上游打得越凶,模型能力进步越快,价格也越往下走。OpenAI Hub 这边主流模型都接入了,一个 Key 调 GPT、Claude、Gemini、DeepSeek,国内直连,OpenAI 格式兼容。后面如果 OpenAI 因为 Shazeer 的加入在年内有新模型发布,第一时间会同步上线。

至于 Shazeer 本人,这位已经在 AI 这条路上跑了 25 年的工程师,在 X 帖子的最后写了一句被很多人转发的话:"Onward."

这位 Transformer 的合著者大概率不会停下来。问题只是,他下一次出现在新闻里,会是给 OpenAI 交出一个新架构,还是又一次新的出走。

参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: