Meta「西瓜」曝光:内部宣称追平 GPT-5.5

Meta 超级智能业务负责人汪滔在内部全员大会上透露,下一代大模型 Watermelon(西瓜)已在关键基准测试中追平 OpenAI 的 GPT-5.5,训练算力较上一代 Avocado 提升一个数量级。
Meta 内部曝光下一代大模型 Watermelon:追平 GPT-5.5,算力较上代提升一个数量级
2026 年 7 月 3 日,据《商业内幕》(Business Insider)当日援引两名知情人士的报道,Meta 超级智能业务负责人汪滔(Alexandr Wang)在最新一次内部全员大会(All-Hands)上向员工透露:Meta 正在训练中的下一代旗舰大模型 Watermelon(西瓜),已在业内密切关注的若干基准测试中追平 OpenAI 今年 4 月发布的旗舰模型 GPT-5.5。虽然汪滔并未点明所引用的具体测试项目,但这一消息一经流出,立即在硅谷及全球 AI 圈引发震动——这是自去年扎克伯格重金押注「超级智能实验室」以来,Meta 首次给出如此明确的对标信号。

一、从「牛油果」到「西瓜」:Meta 的水果代号体系再进一级
汪滔在会上原话为:「Watermelon 是 Avocado(鳄梨 / 牛油果)之后的下一代模型,目前仍在训练。Watermelon 使用的算力比 Avocado 高出一个数量级。」
这里的关键信息需要拆解:
- Avocado(牛油果):Meta 内部对今年 4 月发布的 Muse Spark 系列首款模型的代号。Muse Spark 发布时在基准测试中表现良好,但整体上并未追平或超越 OpenAI、Anthropic、Google 的旗舰模型,也没能扭转开发者和企业客户对 Meta 模型「不在第一梯队」的固有印象。
- Watermelon(西瓜):紧随其后的下一代模型,训练算力较 Avocado 提升「一个数量级」(即约 10 倍)。按照 Meta 今年在 GPU、数据中心上的投入节奏,这一算力跨度极为可信。
- 早前流出的规划显示,Meta 的水果代号序列为 Avocado → Mango → Watermelon,Watermelon 位于该序列的第三代,规模将进一步放大。这意味着 Meta 已经不再仅仅追赶 GPT-5.5,而是在为 GPT-5.6 乃至 GPT-6 时代的对垒预留身位。
用一位知情员工的原话来概括:「过去两年 Meta 一直被贴上『追赶者』的标签,Watermelon 是第一次让我们在内部看到追平的曲线。」
二、追平 GPT-5.5 的时间坐标:为什么是「现在」很关键
要理解「追平 GPT-5.5」这件事的分量,必须把时间线拉出来看:
| 时间 | 事件 | | --- | --- | | 2026 年 4 月 | OpenAI 发布 GPT-5.5,成为当时综合能力最强的旗舰闭源模型 | | 2026 年 4 月 | Meta 发布 Muse Spark(Avocado)系列首款模型,基准良好但未追平第一梯队 | | 2026 年 6 月底 | OpenAI 发布 GPT-5.6——迄今最强模型,但应美国政府要求暂未向公众全面开放 | | 2026 年 7 月 3 日 | 汪滔在 Meta 全员大会上宣布 Watermelon 追平 GPT-5.5 |
换言之,Meta 花了大约 三个月 时间,把自家旗舰模型从「追赶」拉到「追平」的位置。这个速度在过去几年的大模型竞赛中并不常见——但它也意味着一个现实:Meta 追平的是三个月前的天花板,而不是今天的天花板。此刻真正站在山顶的是 GPT-5.6,只不过它由于美国政府的合规审查暂未全量开放。
汪滔本人在会后也在 X(原 Twitter)平台上公开表态,称 Muse Spark 很快将迎来重大更新,编程和智能体(Agent)能力会大幅提升,目标是缩小与竞争对手模型的差距。当有用户直接提问「Meta 何时能推出比肩 Anthropic Claude Opus 的编程模型」时,汪滔的回答相当克制但也颇为自信:
「很快。你们会喜欢我们接下来拿出的成果。」

三、算力提升一个数量级:Meta 的资本战
「Watermelon 使用的算力比 Avocado 高出一个数量级」——这句话背后是 Meta 今年史无前例的资本开支。
Meta 今年年初对投资者披露的资本开支指引已经上调:
- 原预测:芯片、数据中心及其他基础设施投入 1150 亿 – 1350 亿美元
- 最新预测:1250 亿 – 1450 亿美元(按当前汇率约合 8495.34 亿 – 9854.6 亿元人民币)
上调的主要原因是零部件成本上涨与数据中心支出增加。以 Watermelon 相较 Avocado「10 倍算力」的量级来推算,Meta 至少需要在训练集群上完成一次跨代升级——无论是自研 MTIA 芯片的迭代,还是外购 NVIDIA 最新一代 GPU 的集群规模扩张,都对应着数十亿美元级别的单次采购。
从行业视角看,这一投入节奏与几个关键判断一致:
- 算力仍是当前 Scaling 的第一变量:即使算法层已经有 MoE、稀疏化、多模态融合等各种优化,Meta 依然选择把「暴力」加法放到最前面,说明 Meta 内部判断 Scaling Law 至少在 GPT-5.5 / 5.6 这一代仍未走到尽头。
- 数据中心正在向 GW 级别演进:Meta 已在多地推进 Prometheus、Hyperion 级别的超大数据中心项目,Watermelon 的训练规模显然是为这些集群「量身定做」。
- Meta 内部对「一次训不到位」的容忍度上升:从 Avocado 到 Mango 再到 Watermelon 的代号序列表明,Meta 已经采用类似 OpenAI 的「多代同训」策略,同时推进多个模型代次,而不是只押注单个版本。
四、扎克伯格的「人才闪电战」开始见效?
汪滔的表态如果最终被独立第三方基准所验证,将标志着扎克伯格自去年以来「激进人才争夺 + 巨额算力投入」两条腿走路策略的第一次正回报。
关键背景:
- 去年,扎克伯格将原 Meta AI 部门更名为 Superintelligence Labs(超级智能实验室),并任命汪滔为负责人。
- 汪滔目前领导一支代号 TBD 的顶尖 AI 研究团队,同时管理硬件等其他 AI 项目。
- 有报道称,Meta 曾向顶尖 AI 人才开出单人数亿美元级别的签约条件,试图从 OpenAI、Anthropic、Google DeepMind、xAI 等公司挖角。
- 扎克伯格本人在多次投资者电话会中反复强调「不惜代价追赶 AGI / 超级智能」的决心。
在很长一段时间里,市场对这套策略的疑虑非常明显:
- 人才砸钱是否真能换来模型突破?过去大模型研究并不总是「钱多 = 效果好」,团队协作、研究文化、数据质量、评测体系都是变量。
- Meta 过往的开源基因是否会拖累闭源旗舰的商业化节奏?Muse Spark 发布初期,很多开发者仍将 Meta 与「开源 Llama 派」绑定,对其闭源旗舰模型的商业竞争力抱有疑问。
- Meta AI 助手、智能眼镜、社群平台等业务是否真的需要一个「追平 GPT-5.5」级别的模型?
Watermelon 的这一步,如果基准数据经得起独立复现,等于给上述所有疑问同时打了一针强心剂:
「重金 + 一个数量级算力 + 顶级团队」= 至少能造出追平三个月前 SOTA 的模型。
分析人士也指出,Watermelon 若真能稳定达到 GPT-5.5 等级,将直接强化 Meta 在以下四条业务线上的竞争力:
- Meta AI 助手:跨 Facebook、Instagram、WhatsApp、Threads 的对话入口,直接决定日活层面的用户体验。
- Ray-Ban Meta 等智慧眼镜:端云协同下的多模态交互对基础模型能力要求极高。
- 社群平台推荐与创作工具:从内容理解到 AI 生成,模型能力是护城河。
- 企业 AI 服务与广告系统:广告主关注的效果指标高度依赖底层模型的理解与生成能力。
五、「老王卖瓜」的疑云:值得警惕的三点
海外和港台媒体在报道这一消息时,普遍用了一个略带戏谑的标题——「老王卖瓜?」。这不是一句纯粹的玩笑,而是提示读者:这条消息本质上是「内部会议 + 高管本人在 X 上的表态」,尚未有独立第三方基准评测背书。
值得警惕的疑云至少有三点:
- 没有披露具体基准测试项目。汪滔仅提到「备受关注的基准」,但没有说明是 MMLU-Pro、GPQA、SWE-Bench、ARC-AGI、还是内部私有测评集。这是一个非常关键的信息缺口——不同基准的排序在过去半年已多次出现「谁在前」互换的现象。
- 对标的是 GPT-5.5,而不是当前 SOTA。OpenAI 已经在 6 月底发布 GPT-5.6,但由于美国政府合规要求暂未全面开放,社区并没有一个稳定可比对象。这也意味着 Meta 选择了一个「相对可达」的对标位。
- Watermelon 仍在训练中。汪滔明确说「目前仍在训练」,这意味着当前的基准结果很可能是中间 checkpoint 的评估,最终发布版本的表现仍需等待。
换句话说,Watermelon 现阶段的定位更像是 「训练中就能追平三个月前的旗舰」,而不是「已经稳定超越当前最强模型」。这一区别对于开发者、投资人乃至下游企业客户来说,都非常重要。

六、对开发者与生态的影响:值得关注的三个信号
对于关注模型上新的开发者社区来说,Watermelon 这条消息背后有三个更值得盯紧的信号:
1. Muse Spark 系列的「大版本更新」箭在弦上
汪滔在 X 上明确提到,Muse Spark 很快将迎来更新,编程与智能体能力大幅提升。考虑到 Meta 一贯的「先小版本迭代,再大版本发布」节奏,可以预期在 Watermelon 正式亮相之前,会先看到 Muse Spark 的一次显著升级——很可能是把 Avocado 与 Mango 之间的中间成果先释放出来。
对开发者而言,这意味着:
- 编程助手 场景(Cursor、Cline、Continue 等)短期内可能新增一个可选的强力后端。
- Agent 编排 类框架(LangGraph、AutoGen、CrewAI 等)需要考虑对 Muse Spark 新版本进行适配。
- Meta AI 助手在 Threads / WhatsApp 中的表现,将成为 Muse Spark 新版本能力的公开风向标。
2. 「比肩 Claude Opus 的编程模型」的官方 flag
面对用户「什么时候能有比肩 Claude Opus 的编程模型」的直球提问,汪滔选择正面接下这个 flag,回答「很快」。这背后透露出的判断非常清晰:
- Meta 已经把 编程能力(Coding) 视为下一代模型必须打赢的核心战场之一。
- 竞争标杆不再是 GPT-4o、GPT-4.5,而是 Claude Opus 系列——这也侧面反映出 Anthropic 在编程与 Agent 层的口碑正在成为整个行业的隐性天花板。
3. 「多水果代号并行」意味着更快的迭代节奏
从 Avocado → Mango → Watermelon 的序列可以推断,Meta 已经切换到多代次同步训练的模式。参考 OpenAI 从 GPT-5.5 到 GPT-5.6 三个月一迭代的节奏,Meta 未来一年很可能会出现如下节奏:
- 短期(数周内):Muse Spark 大版本更新(可能对应 Mango 或 Avocado-Refresh)。
- 中期(数月内):Watermelon 正式对外发布或内测邀请。
- 长期(年内):下一颗「水果」代号浮出水面,对标 GPT-5.6 / 6.0 级别的模型。
七、一句话总结
Watermelon 是一颗尚未切开的瓜。
从公开信息看,Meta 已经拿出了迄今为止最有说服力的「追赶信号」:一个仍在训练、算力比上代高一个数量级、内部宣称在关键基准上追平三个月前 SOTA 的下一代模型。这足以让市场重新校准对 Meta 的 AI 定价,也足以让开发者把 Muse Spark 生态重新纳入短名单。
但在独立第三方基准公开之前,「追平 GPT-5.5」仍然只是一句来自 Meta 高层的内部承诺。汪滔那句「你们会喜欢我们接下来拿出的成果」既是自信,也是压力——接下来几个月,Muse Spark 的更新版本、Watermelon 的正式亮相,以及它与 GPT-5.6、Claude 下一代 Opus 之间的正面对撞,将真正决定这颗「瓜」的甜度。
对国内开发者来说,值得盯紧的三件事:
- Muse Spark 下一次版本更新的实际编程与 Agent 表现。
- Watermelon 正式发布时是否会附带完整基准数据与技术报告。
- Meta 是否会延续部分开源策略——这将直接决定 Watermelon 会成为一个「只在 Meta 产品里可用的封闭模型」,还是能像 Llama 系列一样反向搅动开源生态。
瓜还没熟,但刀已经在手里了。
参考来源
- 汪滔:Meta 下一代 AI 模型「西瓜」已追上 GPT-5.5 — IT之家:IT之家对《商业内幕》报道的中文完整转述,包含 Watermelon、Avocado 代号、算力提升幅度及 Meta 资本开支上调等核心信息。
- Meta 千亿自研大模型代号规划与延期讨论 — 知乎专栏:较早提及 Meta 内部 Avocado → Mango → Watermelon 水果代号序列的中文分析文章,可作为本次消息的背景对照阅读。



