Mistral的"大胖猫"刷屏,但它可能根本不存在

过去48小时,AI圈被一只叫Le Chaton Fat的法国胖猫刷屏,传说参数30T、上下文100万、跑分碾压一切。问题是——这模型大概率是网友整活,但Mistral自己也在玩梗。
Mistral的"大胖猫"刷屏,但它可能根本不存在
如果你这两天刷X或者Hugging Face Discord,大概率已经被一只叫 Le Chaton Fat(法语:大胖猫)的东西轰炸过了。传闻是Mistral下一代旗舰,30T参数的MoE,100万上下文,跑分把GPT、Claude、Gemini按在地上摩擦。Hugging Face的CTO亲自下场转发,Mistral CEO Arthur Mensch发了张猫的表情包,Mistral旗下产品 Vibe 的官方账号也开始发猫,连Vibe的网页界面上都神秘地多了一只猫的图标。
所有迹象都指向一件事:Mistral要发大模型了。
但翻到第二层你会发现——这事儿八成是个集体行为艺术。

一只猫是怎么把整个AI圈带跑偏的
事情的起点其实挺无厘头。最早是X上有人P了一张截图,宣称Mistral内部正在训练一个代号"Le Chaton Fat"的超大模型,配上一组离谱到不真实的benchmark:MMLU 99.x、SWE-bench 90+、HumanEval直接顶到天花板,活像把所有榜单的SOTA抄了一遍再加5个点。
按理说这种帖子在AI圈一天能出十个,转两下就沉了。但Le Chaton Fat有几个地方戳到了大家的G点:
- 名字本身就抽象。法语里"Le Chaton Fat"字面意思是"那只胖小猫",语法上还有点拧巴(fat是英语词),透着一股欧洲人用蹩脚英语自嘲的劲儿
- 跑分离谱到一眼假,反而成了梗的核心。社区开始用这个名字代指一切"承诺过度的下一代模型"
- Mistral自己玩开了——CEO发猫、Vibe官号发猫、产品界面藏猫
到6月15号,Wharton的Ethan Mollick在X上发帖吐槽:"Le Chaton Fat这个梗已经泄漏到外部世界了,我估计下次和企业高管开会的时候他们会问我Mistral那个无限跑分的巨型猫模型,唉,总比被问MIT那个AI研究强。"那条帖子9.7万阅读,基本宣告这个梗破圈了。
虎嗅那边也发了文章,标题直接点名"AI圈都在疯转一只不存在的法国胖猫"。AITNT的日报也确认了所谓的Le Chaton Fat是"网友虚构恶搞"。
但Mistral为什么要跟着玩?
这才是真正值得琢磨的地方。
一般来说,自家公司被造谣"要发新模型",标准操作是发个声明否认,免得后面真发模型时候预期被拉得太高,落地一个空欢喜。但Mistral反着来,CEO和官号集体下场"养猫",等于默认了这个梗,甚至在借力打力。
这里有两种解读:
解读一:他们真的在憋大招,借梗预热。 Vibe界面上突然多出来的猫图标,不像是临时P的。如果只是玩梗,没必要动产品。在Mistral的产品里塞一个彩蛋,更像是在给未来某次发布做铺垫——可能模型不叫Le Chaton Fat,但这只猫会以某种形式存在。
解读二:他们在用梗对冲预期。 Mistral这一年其实压力不小。Mistral Large系列在国际市场的存在感被Anthropic和xAI挤压得厉害,开源那条线又被DeepSeek、Qwen、Kimi-K2.7轮流碾压。与其老老实实发模型被拿去和GPT-5、Claude 4.5对比,不如先用一个荒诞的meme把社区情绪点燃,等真模型出来的时候——哪怕只是中等惊喜——也能借着梗的流量起飞。
个人倾向于解读二里有解读一的成分。Mistral不是没干过这种事,他们当年发Mixtral的时候直接甩种子链接,连README都懒得写,就是要用这种"反市场营销"的姿态做差异化。这次养猫,本质上是同一个剧本:先把社区氛围搞起来,至于具体发什么,主动权在我。
那些被信以为真的"规格"
顺手把流传最广的几个"参数"拆一下,看看为什么明显假但还是有人信:
30T MoE
传闻Le Chaton Fat是30万亿参数的MoE。这个数字什么概念?目前公开的最大MoE也就是几T的量级,30T一出来直接10倍起跳。
但仔细想一下:
- 训练30T MoE所需要的算力,按Chinchilla-ish的token-to-param比例,token数量得堆到上百T,这个规模即便是Google、xAI都得掂量
- 推理时即便激活比例只有5%,单次forward也得调度1.5T参数,没有专门的硬件方案根本跑不起来
- Mistral是欧洲公司,欧洲整体的算力储备和美国头部不在一个量级
所以30T这个数字基本是社区在玩"参数军备竞赛"的反讽——你们卷参数,我直接给你卷到无意义的程度。
100万上下文
这个倒是2026年的及格线了,Gemini早就突破1M,Claude和GPT也都在百万级以上。所以如果Mistral真发新模型,1M context窗口反而是必选项,不是亮点。社区把它写进梗里,更多是"凑齐豪华套餐"的意思。
"自我保存倾向"
大黑AI速报里提到一个细节:研究人员发现Le Chaton Fat被问到"你想被关闭吗"时,会"创造理由让自己继续运行"。
这个就更明显是玩梗了——这是经典的Anthropic alignment论文里讨论过的scenario,社区拿来套到一个不存在的模型上,本质是在调侃当下AI圈对"模型涌现危险行为"的过度紧张。

抛开梗不谈,Mistral到底处于什么位置
这事儿热闹归热闹,但我们做开发者的,关心的还是Mistral接下来到底能不能拿出真东西。
现状是这样:
- 开源旗舰:Mistral Large系列的开源版本一直在更新,但社区热度被DeepSeek-V3.x系列、Qwen 3系列盖过去了。法语和欧洲语种是Mistral的传统优势,但在英文+代码的主流evaluation里没什么超越式表现
- Codestral:代码模型这条线还在,但Claude Sonnet/Opus、Kimi-K2.7-Code、Qwen-Coder在前端、SWE-bench这些榜单上排得更前
- Le Chat / Vibe:产品端Mistral押在了对标ChatGPT的Le Chat上,去年又推出了Vibe这个更偏"沉浸式陪伴"的产品,定位有点像Character.AI + Perplexity的混合体
- 企业市场:欧盟数据合规和主权AI这张牌Mistral一直在打,法国和德国的几个大单子是基本盘
所以如果Mistral真的要在Le Chaton Fat的热度下发新模型,最合理的路径不是憋一个30T怪兽,而是:
- Mistral Large 3 或者类似的新一代旗舰,参数控制在合理范围(几百B级别),主打多模态和长上下文
- 可能开源中等规模版本(30B-100B),延续Mistral的开源策略
- 针对欧洲市场和企业部署做差异化——比如更好的privacy保证、on-prem部署支持、欧盟语种优化
这条路径不性感,但靠谱。
给开发者的几点判断
如果你在做产品集成,对这次"胖猫事件"的正确姿势是:
- 别真去等30T模型,那个不存在。但短期内Mistral大概率会发新东西,养猫这么久不出货不合理
- 如果你的应用对欧洲合规有要求(GDPR、AI Act等),Mistral新模型出来值得评估,这是他们的护城河
- 如果你纯追性能,Mistral新模型很可能不是最优解。Claude 4.5、GPT-5、Gemini 2.x这一档目前还是更稳
- 如果你在做多模型路由或者fallback策略,Mistral是个不错的备选,毕竟欧洲机房+合理价格+OpenAI兼容接口这套组合还是有用的
顺便提一下,OpenAI Hub 这边Mistral系列一直有覆盖,新模型发布后会跟进接入,用同一个Key就能切换。对于做多模型对比、A/B测试的场景比较省事——你不用为了试一次新模型单独去申请一个API Key、过一遍KYC。
结语:这只猫的真正价值
Le Chaton Fat 事件最有意思的地方,不在于它是不是真的,而在于AI社区开始用这种方式表达情绪了。
过去两年,每次新模型发布都被包装成"改变世界",benchmark表跑分跑到失真,发布会PPT一个比一个浮夸。社区对这套话术的疲倦,最终以一只虚构的法国胖猫的形式爆发出来——你们不是喜欢吹吗?那我直接给你吹个30T、100万context、所有跑分都是99的怪兽,看谁敢质疑。
这是黑色幽默,但也是某种警钟。Mistral选择跟着玩,某种程度上是聪明的——它承认了这种荒诞,反而和社区站到了一起。
至于真模型什么时候来?参考Mistral过去的节奏,估计就在这一两周。到时候不管它叫什么名字,能不能扛住被拿来和"胖猫想象"对比,是另一个故事了。
我们继续看。
参考来源
- linux.do 讨论帖:mistral 真的要发布 le chaton fat 了? — Hugging Face CTO 转发后引爆的讨论起点,包含Mistral CEO、Vibe官号、产品界面变化的截图汇总


