小米撒100万亿Token,MiMo要抢开源生态的牌桌

行业快讯

小米今日凌晨同步开源 MiMo-V2.5 系列模型并启动 Orbit 百万亿 Token 创造者激励计划,30 天内向全球开发者免费发放 100T Token,MIT 协议全量开放权重,意图以「模型+生态」组合拳切入 AI 开发者市场。

凌晨放大招:开源 + 百万亿 Token 一起来

今天(4 月 28 日)凌晨,小米技术团队一口气干了两件事:正式开源 MiMo-V2.5 系列模型,同时启动名为「MiMo Orbit」的百万亿 Token 创造者激励计划。

简单说就是——模型权重全给你,Token 也免费送你用。30 天,100 万亿 Token,赠完即止。

这个动作的信号很明确:小米不只是要做一个能打的开源模型,它要围绕 MiMo 建一个开发者生态。而「撒 Token」是最直接的拉人方式。

MiMo Orbit 百万亿 Token 创造者激励计划官方宣传图

MiMo-V2.5:两款模型,100 万上下文窗口

先看模型本身。MiMo-V2.5 系列在 4 月 23 日就已经开启公测,这次是正式开源。系列包含两款模型:

  • MiMo-V2.5-Pro:定位复杂任务场景,深度适配 Agent 和 Coding 应用。在 GDPVal-AA 和 ClawEval 两个榜单上拿到了全球开源模型第一。
  • MiMo-V2.5:原生全模态模型,支持文本、图像、视频、音频理解,同样具备 Agent 能力。

两款模型都支持 100 万上下文窗口。这个长度在开源模型里属于第一梯队——作为参考,目前主流开源模型的上下文窗口普遍在 12.8 万到 32 万之间,能做到百万级别的屈指可数。

小米技术团队在公告里说了一句值得注意的话:「模型的真正价值不在于榜单排名,而在于能否高效帮助开发者解决实际问题。」这话听起来像套话,但结合他们在 Claw-Eval 上的表现来看,确实有底气——MiMo-V2.5 在这个榜单上位列任务完成率与 Token 效率的最优前沿。

换句话说,不只是「能做到」,还要「用更少的 Token 做到」。对开发者来说,Token 效率直接关系到成本,这比单纯的跑分更实在。

MIT 协议,全量开放,没有套路

开源的诚意怎么看?看协议。

MiMo-V2.5 系列采用 MIT 协议,这是目前最宽松的开源协议之一。意味着:

  • 自由商用,不需要额外授权
  • 可以二次训练、微调
  • Base 模型权重也一并开放

对比来看,不少国产大模型虽然号称「开源」,但要么限制商用场景,要么只开放 Chat 版本不给 Base 权重,要么搞一个自定义协议让你读半天。MiMo 这次的做法比较干脆,MIT 协议就是「你随便用」。

这对想基于开源模型做垂直场景微调的团队来说是个好消息。拿到 Base 权重意味着你可以从更底层开始定制,而不是只能在 Chat 模型上面做 LoRA。

Orbit 计划拆解:两条腿走路

MiMo Orbit 计划分为两个部分,分别瞄准不同的开发者群体:

1. 百万亿 Token 创造者激励计划

面向所有 AI builder。核心规则:

  • 时间窗口:2026 年 4 月 28 日 00:00 至 5 月 28 日 00:00(北京时间)
  • 总量:100 万亿(100T)Token
  • 方式:申请制,审核通过后发放
  • 最高档位:Max 档,包含 16 亿 Credits,官方标价 659 元
  • 领取地址:100t.xiaomimimo.com

100 万亿 Token 是什么概念?粗略算一下,如果按照目前主流 API 的定价(以 GPT-4o 为参照,大约 $2.5/1M input tokens),100T Token 的市场价值在数亿美元量级。当然,小米自家模型的定价体系不同,但这个数字本身就是一个很有冲击力的营销信号。

从社区反馈来看,已经有开发者收到了 Token Plan。Linux.do 上有用户表示额度已到账,正在评估「一个月的额度够不够养 2 匹 1 只虾」——这是社区黑话,大意是能不能同时跑多个 Agent 应用。也有用户在问申请经验,说明活动刚启动,流程还在摸索中。

2. Agent 生态共建计划

这部分面向 Agent 框架团队,小米提供 MiMo Token 限免支持,让框架的用户可以免费接入 MiMo 系列模型。

这一步棋下得比较聪明。与其自己去推广模型,不如让 Agent 框架把 MiMo 作为默认可选模型之一。用户在框架里用着用着就习惯了,生态就起来了。

这和当年各家云厂商给开源项目提供免费额度的逻辑一样——先让人用起来,后面的事后面再说。

硬件生态:Day-0 适配不是说说而已

开源模型最怕的一件事是什么?发布了,但跑不起来。

小米这次在硬件适配上做了不少功课。MiMo-V2.5-Pro 在开源首日就完成了多个芯片厂商的接入适配:

  • 平头哥真武 810E:依托全栈自研 AI 软件栈完成深度适配
  • AWS Trainium2:基于 Neuron SDK + vLLM 推理框架完成适配,实现「开源即全球可用」
  • AMD:依托 ROCm 开源软件栈提供 Day-0 适配

同时,主流推理框架 SGLang 和 vLLM 也完成了 Day-0 适配。

这意味着什么?如果你手上有 AMD 的卡、或者在用 AWS 的 Trainium 实例、或者用的是平头哥的芯片,模型开源当天你就能跑起来。不用等社区适配,不用自己踩坑。

这种「Day-0 适配」的做法在国内开源模型里并不常见。大多数模型开源后,社区需要几天甚至几周才能在非 NVIDIA 硬件上跑通。小米提前和芯片厂商合作完成适配,说明他们对开源生态的理解不只是「把权重扔出去」。

放在行业里看:小米在打什么算盘?

2026 年的开源大模型赛道已经相当拥挤。Qwen、DeepSeek、Llama、Mistral、GLM……每家都在卷。小米作为一个「非典型」的大模型玩家——它的主业毕竟是手机和 IoT——为什么要在这个时间点砸这么大的资源?

几个观察:

第一,小米有场景。手机、汽车、智能家居、可穿戴设备——小米的硬件生态是国内最完整的之一。一个足够好的自研模型,可以成为串联所有设备的「大脑」。这不是为了跟 OpenAI 竞争通用 AGI,而是为了让小米的硬件生态更智能。

第二,开源是最快的验证方式。与其关起门来自己测,不如让全球开发者帮你测。100 万亿 Token 的免费额度,本质上是在用真金白银买用户反馈。

第三,Agent 是当前最热的应用方向。MiMo-V2.5-Pro 深度适配 Agent 和 Coding 场景,Orbit 计划专门设了 Agent 生态共建板块——小米显然认为 Agent 是模型落地的关键路径。这个判断和行业共识一致:2026 年,大家都在从「聊天机器人」转向「能干活的 Agent」。

第四,100 万上下文窗口是 Agent 场景的刚需。Agent 需要处理大量的上下文信息——代码仓库、文档、对话历史、工具调用记录——短上下文的模型根本撑不住复杂的 Agent 工作流。MiMo 在这个维度上的投入是有针对性的。

和竞品比,MiMo 的位置在哪?

坦率地说,MiMo 在通用能力上可能还不是开源模型的绝对第一。Qwen 和 DeepSeek 在社区积累和模型迭代速度上仍然领先。但 MiMo 有几个差异化的点:

  • 全模态原生支持(文本+图像+视频+音频),不是后期拼接的
  • 100 万上下文窗口,在开源模型里属于顶配
  • Agent 和 Coding 场景的深度优化,不是泛泛的「什么都能做」
  • MIT 协议 + Base 权重全开,商用友好度拉满
  • 背后有小米的硬件生态做落地场景

劣势也很明显:社区生态还在早期,开发者工具链不够成熟,第三方教程和经验分享还很少(Linux.do 上有用户吐槽「怎么还没有经验贴」)。

100 万亿 Token 的激励计划,某种程度上就是在用钱换时间,快速把社区拉起来。

对开发者来说,值不值得试?

如果你在做 Agent 相关的项目,MiMo-V2.5-Pro 值得认真评估。100 万上下文窗口 + Agent 场景优化 + 免费 Token,这个组合对 Agent 开发者来说很有吸引力。

如果你在做多模态应用,MiMo-V2.5 的原生全模态能力也值得一试。不用自己拼接不同的模型来处理不同模态的输入,一个模型搞定。

如果你只是想找一个通用的开源模型做日常开发,那 Qwen 和 DeepSeek 的社区生态更成熟,踩坑的人更多,资料更全。MiMo 目前还在「早期红利」阶段——好处是免费额度多,坏处是遇到问题可能没人帮你答。

申请地址:100t.xiaomimimo.com,活动持续到 5 月 28 日。建议尽早申请,100T 听起来很多,但架不住全球开发者一起薅。

一个更大的趋势

小米这次的动作,放在更大的背景下看,是国产大模型「卷生态」的又一个信号。

过去两年,大家卷的是模型能力——谁的跑分高、谁的参数多、谁先支持多模态。现在,模型能力的差距在缩小,竞争的焦点正在转向生态:谁的开发者多、谁的工具链好、谁的落地场景丰富。

百万亿 Token 免费送,MIT 协议全量开放,Day-0 多硬件适配,Agent 框架共建——这些动作的核心逻辑都是一样的:降低开发者的使用门槛,让更多人用起来。

模型本身是基础设施,生态才是护城河。小米显然想明白了这一点。至于 MiMo 能不能真正建起一个有活力的开发者生态,100 万亿 Token 烧完之后还能不能留住人,这个问题的答案,大概要等到 5 月 28 日之后才能看到。


参考来源: