Meta 超级智能业务负责人汪滔在内部全员大会上透露，下一代大模型 Watermelon（西瓜）已在关键基准测试中追平 OpenAI 的 GPT-5.5，训练算力较上一代 Avocado 提升一个数量级。

Meta 内部曝光下一代大模型 Watermelon：追平 GPT-5.5，算力较上代提升一个数量级

2026 年 7 月 3 日，据《商业内幕》（Business Insider）当日援引两名知情人士的报道，Meta 超级智能业务负责人汪滔（Alexandr Wang）在最新一次内部全员大会（All-Hands）上向员工透露：Meta 正在训练中的下一代旗舰大模型 Watermelon（西瓜），已在业内密切关注的若干基准测试中追平 OpenAI 今年 4 月发布的旗舰模型 GPT-5.5。虽然汪滔并未点明所引用的具体测试项目，但这一消息一经流出，立即在硅谷及全球 AI 圈引发震动——这是自去年扎克伯格重金押注「超级智能实验室」以来，Meta 首次给出如此明确的对标信号。

Meta 超级智能实验室内部大会现场，屏幕上打出 Watermelon 项目代号

一、从「牛油果」到「西瓜」：Meta 的水果代号体系再进一级

汪滔在会上原话为：「Watermelon 是 Avocado（鳄梨 / 牛油果）之后的下一代模型，目前仍在训练。Watermelon 使用的算力比 Avocado 高出一个数量级。」

这里的关键信息需要拆解：

Avocado（牛油果）：Meta 内部对今年 4 月发布的 Muse Spark 系列首款模型的代号。Muse Spark 发布时在基准测试中表现良好，但整体上并未追平或超越 OpenAI、Anthropic、Google 的旗舰模型，也没能扭转开发者和企业客户对 Meta 模型「不在第一梯队」的固有印象。
Watermelon（西瓜）：紧随其后的下一代模型，训练算力较 Avocado 提升「一个数量级」（即约 10 倍）。按照 Meta 今年在 GPU、数据中心上的投入节奏，这一算力跨度极为可信。
早前流出的规划显示，Meta 的水果代号序列为 Avocado → Mango → Watermelon，Watermelon 位于该序列的第三代，规模将进一步放大。这意味着 Meta 已经不再仅仅追赶 GPT-5.5，而是在为 GPT-5.6 乃至 GPT-6 时代的对垒预留身位。

用一位知情员工的原话来概括：「过去两年 Meta 一直被贴上『追赶者』的标签，Watermelon 是第一次让我们在内部看到追平的曲线。」

二、追平 GPT-5.5 的时间坐标：为什么是「现在」很关键

要理解「追平 GPT-5.5」这件事的分量，必须把时间线拉出来看：

| 时间 | 事件 | | --- | --- | | 2026 年 4 月 | OpenAI 发布 GPT-5.5，成为当时综合能力最强的旗舰闭源模型 | | 2026 年 4 月 | Meta 发布 Muse Spark（Avocado）系列首款模型，基准良好但未追平第一梯队 | | 2026 年 6 月底 | OpenAI 发布 GPT-5.6——迄今最强模型，但应美国政府要求暂未向公众全面开放 | | 2026 年 7 月 3 日 | 汪滔在 Meta 全员大会上宣布 Watermelon 追平 GPT-5.5 |

换言之，Meta 花了大约 三个月 时间，把自家旗舰模型从「追赶」拉到「追平」的位置。这个速度在过去几年的大模型竞赛中并不常见——但它也意味着一个现实：Meta 追平的是三个月前的天花板，而不是今天的天花板。此刻真正站在山顶的是 GPT-5.6，只不过它由于美国政府的合规审查暂未全量开放。

汪滔本人在会后也在 X（原 Twitter）平台上公开表态，称 Muse Spark 很快将迎来重大更新，编程和智能体（Agent）能力会大幅提升，目标是缩小与竞争对手模型的差距。当有用户直接提问「Meta 何时能推出比肩 Anthropic Claude Opus 的编程模型」时，汪滔的回答相当克制但也颇为自信：

「很快。你们会喜欢我们接下来拿出的成果。」

汪滔在 X 上关于 Muse Spark 更新与 Watermelon 训练进度的公开发言截图

三、算力提升一个数量级：Meta 的资本战

「Watermelon 使用的算力比 Avocado 高出一个数量级」——这句话背后是 Meta 今年史无前例的资本开支。

Meta 今年年初对投资者披露的资本开支指引已经上调：

原预测：芯片、数据中心及其他基础设施投入 1150 亿 – 1350 亿美元
最新预测：1250 亿 – 1450 亿美元（按当前汇率约合 8495.34 亿 – 9854.6 亿元人民币）

上调的主要原因是零部件成本上涨与数据中心支出增加。以 Watermelon 相较 Avocado「10 倍算力」的量级来推算，Meta 至少需要在训练集群上完成一次跨代升级——无论是自研 MTIA 芯片的迭代，还是外购 NVIDIA 最新一代 GPU 的集群规模扩张，都对应着数十亿美元级别的单次采购。

从行业视角看，这一投入节奏与几个关键判断一致：

算力仍是当前 Scaling 的第一变量：即使算法层已经有 MoE、稀疏化、多模态融合等各种优化，Meta 依然选择把「暴力」加法放到最前面，说明 Meta 内部判断 Scaling Law 至少在 GPT-5.5 / 5.6 这一代仍未走到尽头。
数据中心正在向 GW 级别演进：Meta 已在多地推进 Prometheus、Hyperion 级别的超大数据中心项目，Watermelon 的训练规模显然是为这些集群「量身定做」。
Meta 内部对「一次训不到位」的容忍度上升：从 Avocado 到 Mango 再到 Watermelon 的代号序列表明，Meta 已经采用类似 OpenAI 的「多代同训」策略，同时推进多个模型代次，而不是只押注单个版本。

四、扎克伯格的「人才闪电战」开始见效？

汪滔的表态如果最终被独立第三方基准所验证，将标志着扎克伯格自去年以来「激进人才争夺 + 巨额算力投入」两条腿走路策略的第一次正回报。

关键背景：

去年，扎克伯格将原 Meta AI 部门更名为 Superintelligence Labs（超级智能实验室），并任命汪滔为负责人。
汪滔目前领导一支代号 TBD 的顶尖 AI 研究团队，同时管理硬件等其他 AI 项目。
有报道称，Meta 曾向顶尖 AI 人才开出单人数亿美元级别的签约条件，试图从 OpenAI、Anthropic、Google DeepMind、xAI 等公司挖角。
扎克伯格本人在多次投资者电话会中反复强调「不惜代价追赶 AGI / 超级智能」的决心。

在很长一段时间里，市场对这套策略的疑虑非常明显：

人才砸钱是否真能换来模型突破？过去大模型研究并不总是「钱多 = 效果好」，团队协作、研究文化、数据质量、评测体系都是变量。
Meta 过往的开源基因是否会拖累闭源旗舰的商业化节奏？Muse Spark 发布初期，很多开发者仍将 Meta 与「开源 Llama 派」绑定，对其闭源旗舰模型的商业竞争力抱有疑问。
Meta AI 助手、智能眼镜、社群平台等业务是否真的需要一个「追平 GPT-5.5」级别的模型？

Watermelon 的这一步，如果基准数据经得起独立复现，等于给上述所有疑问同时打了一针强心剂：

「重金 + 一个数量级算力 + 顶级团队」= 至少能造出追平三个月前 SOTA 的模型。

分析人士也指出，Watermelon 若真能稳定达到 GPT-5.5 等级，将直接强化 Meta 在以下四条业务线上的竞争力：

Meta AI 助手：跨 Facebook、Instagram、WhatsApp、Threads 的对话入口，直接决定日活层面的用户体验。
Ray-Ban Meta 等智慧眼镜：端云协同下的多模态交互对基础模型能力要求极高。
社群平台推荐与创作工具：从内容理解到 AI 生成，模型能力是护城河。
企业 AI 服务与广告系统：广告主关注的效果指标高度依赖底层模型的理解与生成能力。

五、「老王卖瓜」的疑云：值得警惕的三点

海外和港台媒体在报道这一消息时，普遍用了一个略带戏谑的标题——「老王卖瓜？」。这不是一句纯粹的玩笑，而是提示读者：这条消息本质上是「内部会议 + 高管本人在 X 上的表态」，尚未有独立第三方基准评测背书。

值得警惕的疑云至少有三点：

没有披露具体基准测试项目。汪滔仅提到「备受关注的基准」，但没有说明是 MMLU-Pro、GPQA、SWE-Bench、ARC-AGI、还是内部私有测评集。这是一个非常关键的信息缺口——不同基准的排序在过去半年已多次出现「谁在前」互换的现象。
对标的是 GPT-5.5，而不是当前 SOTA。OpenAI 已经在 6 月底发布 GPT-5.6，但由于美国政府合规要求暂未全面开放，社区并没有一个稳定可比对象。这也意味着 Meta 选择了一个「相对可达」的对标位。
Watermelon 仍在训练中。汪滔明确说「目前仍在训练」，这意味着当前的基准结果很可能是中间 checkpoint 的评估，最终发布版本的表现仍需等待。

换句话说，Watermelon 现阶段的定位更像是 「训练中就能追平三个月前的旗舰」，而不是「已经稳定超越当前最强模型」。这一区别对于开发者、投资人乃至下游企业客户来说，都非常重要。

2026 年上半年主流大模型基准分数对比示意图

六、对开发者与生态的影响：值得关注的三个信号

对于关注模型上新的开发者社区来说，Watermelon 这条消息背后有三个更值得盯紧的信号：

1. Muse Spark 系列的「大版本更新」箭在弦上

汪滔在 X 上明确提到，Muse Spark 很快将迎来更新，编程与智能体能力大幅提升。考虑到 Meta 一贯的「先小版本迭代，再大版本发布」节奏，可以预期在 Watermelon 正式亮相之前，会先看到 Muse Spark 的一次显著升级——很可能是把 Avocado 与 Mango 之间的中间成果先释放出来。

对开发者而言，这意味着：

编程助手 场景（Cursor、Cline、Continue 等）短期内可能新增一个可选的强力后端。
Agent 编排 类框架（LangGraph、AutoGen、CrewAI 等）需要考虑对 Muse Spark 新版本进行适配。
Meta AI 助手在 Threads / WhatsApp 中的表现，将成为 Muse Spark 新版本能力的公开风向标。

2. 「比肩 Claude Opus 的编程模型」的官方 flag

面对用户「什么时候能有比肩 Claude Opus 的编程模型」的直球提问，汪滔选择正面接下这个 flag，回答「很快」。这背后透露出的判断非常清晰：

Meta 已经把 编程能力（Coding） 视为下一代模型必须打赢的核心战场之一。
竞争标杆不再是 GPT-4o、GPT-4.5，而是 Claude Opus 系列——这也侧面反映出 Anthropic 在编程与 Agent 层的口碑正在成为整个行业的隐性天花板。

3. 「多水果代号并行」意味着更快的迭代节奏

从 Avocado → Mango → Watermelon 的序列可以推断，Meta 已经切换到多代次同步训练的模式。参考 OpenAI 从 GPT-5.5 到 GPT-5.6 三个月一迭代的节奏，Meta 未来一年很可能会出现如下节奏：

短期（数周内）：Muse Spark 大版本更新（可能对应 Mango 或 Avocado-Refresh）。
中期（数月内）：Watermelon 正式对外发布或内测邀请。
长期（年内）：下一颗「水果」代号浮出水面，对标 GPT-5.6 / 6.0 级别的模型。

七、一句话总结

Watermelon 是一颗尚未切开的瓜。

从公开信息看，Meta 已经拿出了迄今为止最有说服力的「追赶信号」：一个仍在训练、算力比上代高一个数量级、内部宣称在关键基准上追平三个月前 SOTA 的下一代模型。这足以让市场重新校准对 Meta 的 AI 定价，也足以让开发者把 Muse Spark 生态重新纳入短名单。

但在独立第三方基准公开之前，「追平 GPT-5.5」仍然只是一句来自 Meta 高层的内部承诺。汪滔那句「你们会喜欢我们接下来拿出的成果」既是自信，也是压力——接下来几个月，Muse Spark 的更新版本、Watermelon 的正式亮相，以及它与 GPT-5.6、Claude 下一代 Opus 之间的正面对撞，将真正决定这颗「瓜」的甜度。

对国内开发者来说，值得盯紧的三件事：

Muse Spark 下一次版本更新的实际编程与 Agent 表现。
Watermelon 正式发布时是否会附带完整基准数据与技术报告。
Meta 是否会延续部分开源策略——这将直接决定 Watermelon 会成为一个「只在 Meta 产品里可用的封闭模型」，还是能像 Llama 系列一样反向搅动开源生态。

瓜还没熟，但刀已经在手里了。

参考来源

汪滔：Meta 下一代 AI 模型「西瓜」已追上 GPT-5.5 — IT之家：IT之家对《商业内幕》报道的中文完整转述，包含 Watermelon、Avocado 代号、算力提升幅度及 Meta 资本开支上调等核心信息。
Meta 千亿自研大模型代号规划与延期讨论 — 知乎专栏：较早提及 Meta 内部 Avocado → Mango → Watermelon 水果代号序列的中文分析文章，可作为本次消息的背景对照阅读。

Meta「西瓜」曝光：内部宣称追平 GPT-5.5