小米 MiMo-V2.5 API 降价 99%,Token Plan 额度暴涨 51 倍
5 月 27 日凌晨,小米 MiMo 官方宣布对整个模型价格体系进行永久性调整。MiMo-V2.5 系列 API 最高降幅达 99%,Token Plan 套餐额度从原来的 16 亿 Credits 提升至 820 亿 Credits,所有在有效期内的订阅用户额度全量重置。这是继 DeepSeek 之后,中国大模型厂商在价格战中的又一次激进出手。
降价逻辑:99% 是怎么算出来的
官方口径里的"最高降幅 99%"主要针对缓存输入场景。新定价不再区分 256k 和 1M 上下文窗口长度,统一按新的 Credits 消耗规则计费:
- MiMo-V2.5:输入 100 Credits/token,输出 200 Credits/token
- MiMo-V2.5-Pro:输入 300 Credits/token,输出 600 Credits/token
对比此前 1 Token = 4 Credits 且区分窗口长度的复杂计费方式,新规则确实简化了不少。但这里有个关键点:套餐额度虽然从数字上涨了 51 倍(Max 档从 16 亿涨到 820 亿),但每次调用消耗的 Credits 也同步上调了。官方给出的实际口径是可用量提升 5-8 倍,而非 51 倍。
这种"数字膨胀"的操作在云服务定价里并不罕见。本质上是把计费单位重新标定,让用户感知到"额度变大了",但实际购买力的提升幅度要打个折扣。不过即便按 5-8 倍算,对于重度用户来说也是实打实的成本下降。

Token Plan 四档全面升级
具体到各档位,新版 Token Plan 的 Credits 额度调整如下:
| 档位 | 旧版额度 | 新版额度 | 涨幅 |
|---|---|---|---|
| Lite | 0.6 亿 | 41 亿 | 68 倍 |
| Standard | 2 亿 | 110 亿 | 55 倍 |
| Pro | 7 亿 | 380 亿 | 54 倍 |
| Max | 16 亿 | 820 亿 | 51 倍 |
所有已订阅且仍在有效期内的用户,无论当前用量如何,额度将于 5 月 27 日 0:00 全量重置为新标准。这意味着如果你上个月刚买了 Max 档还没用完,现在直接给你重置成 820 亿 Credits,相当于白送了一大笔额度。
官方还特别提到,针对 Token Plan 已过期的历史付费用户,也准备了"惊喜好礼",将在未来一周公布。这种对老用户的补偿姿态,在国内大模型厂商里算是比较少见的。
夜间 8 折 + 包年 88 折,小米在学谁
除了额度调整,Token Plan 还新增了两个定价策略:
夜间专属优惠:每天 00:00-08:00,所有模型 Credits 消耗速率在原有基础上再打 8 折。这个设计明显是在引导用户错峰使用,降低高峰时段的推理压力。
包年订阅折扣:一次性订阅全年享 88 折,最高可减 948.96 元。连续包月模式下,老用户次月 7 折,新用户次月 77 折。
这套组合拳的逻辑很清晰:用价格杠杆调节用户行为,同时通过长周期订阅锁定用户。夜间 8 折的设计在云计算领域早有先例(AWS、阿里云都有类似的"闲时折扣"),但在大模型 API 定价里还不多见。
值得注意的是,小米这次取消了此前饱受吐槽的"1 Token = 4 Credits"计费方式,改为直接按 Token 消耗倍率计费。这种简化对开发者更友好,不用再去算复杂的换算关系。
百万亿 Token 计划提前收官
小米在 4 月底启动的"百万亿 Token 创造者激励计划"原定 30 天发放 100T Tokens,结果在 5 月 26 日 16:08 就提前发完了。这个速度说明两件事:一是小米在推广上确实舍得砸钱,二是开发者对免费额度的需求远超预期。
这个计划采取申请制,通过审核的用户最高可获得 Max 档 Token Plan(价值 659 元)。虽然活动已经结束,但 Apache 软件基金会成员的专属福利仍然长期有效。这种针对开源社区的定向支持,是小米在生态建设上的一个长线投入。
价格战的终局是什么
小米这次降价,放在更大的背景下看,是中国大模型厂商集体向成本要效率的一个缩影。DeepSeek 在今年初把推理成本打到了一个新低点,逼得 OpenAI、Anthropic 这些美国厂商也不得不跟进降价。但中美两边的降价逻辑不太一样:
- 美国厂商:降价是为了守住市场份额,但核心还是要保证利润率。所以你会看到 OpenAI 降价的同时,也在推更贵的企业版、更高级的订阅计划。
- 中国厂商:降价是为了抢开发者生态。现阶段利润不是第一优先级,先把用户规模做起来,再考虑商业化路径。
小米的打法更接近后者。MiMo-V2.5 系列在 4 月底开源时就采用了宽松的 MIT 协议,允许自由商用、二次训练,不需要额外授权。这种"开源 + 低价 API"的组合,目标很明确:让开发者用起来没有心理负担,先把生态做起来。
但这种"零利润率"的竞赛能持续多久?Hacker News 上有开发者质疑,这些受限于芯片供应的公司,如何在缺乏顶级 H100 或 Blackwell 硬件的情况下维持推理能力。小米的答案可能是 SGLang 这类推理优化技术。官方提到 MiMo-V2.5 系列已完成 SGLang 和 vLLM 的 Day-0 适配,并且在平头哥真武 810E、AMD ROCm、燧原 L600 等国产芯片上都跑通了。
换句话说,小米在用软件优化 + 国产算力的组合,绕开对英伟达高端芯片的依赖。这条路能不能走通,直接决定了这场价格战的可持续性。
Token 效率:比 Kimi K2.6 省 42%
降价之外,小米这次还重点强调了 Token 效率。官方数据显示:
- MiMo-V2.5-Pro 在达到与 Kimi K2.6 相同的 ClawEval 分数时,节省了 42% Token
- MiMo-V2.5 在达到与 Meta Muse Spark 相同分数时,节省了 50% Token
Token 效率这个指标在 Agent 场景下尤其重要。因为 Agent 任务往往涉及大量工具调用、多轮对话、长上下文处理,Token 消耗是成本的大头。如果能在保证性能的前提下减少 Token 消耗,对开发者来说就是真金白银的节省。
小米在 4 月发布 MiMo-V2.5 系列时,就展示了几个极端案例:
- SysY 编译器任务:4.3 小时、672 次工具调用,完成北大本科生需要数周才能搞定的编译原理课程项目
- 视频编辑器开发:11.5 小时、1868 次工具调用,交付 8192 行代码的完整 Web 应用
- 模拟电路 EDA 设计:1 小时闭环迭代,完成经验丰富的工程师需要数天的 FVF-LDO 设计
这些案例的共同点是:任务复杂度高、工具调用次数多、上下文窗口长。在这种场景下,Token 效率的提升直接转化为成本优势。
对开发者意味着什么
从开发者视角看,这次调价有几个实际影响:
成本可预测性更强:取消复杂的倍率计费,改为统一的 Credits 消耗规则,开发者更容易估算成本。
长周期任务更划算:夜间 8 折 + 包年 88 折的组合,对跑批处理、数据标注、模型微调这类非实时任务很友好。
Agent 开发门槛降低:Token 效率提升 + API 降价,让原本因为成本问题搁置的 Agent 项目变得可行。
多模态能力下放:MiMo-V2.5 支持原生全模态(图像、音频、视频),且 API 成本比上一代降低 50%,这意味着多模态 Agent 不再是大厂专属。
但也有需要注意的点:小米的 Token Plan 是订阅制,不是按量付费。如果你的用量波动很大,可能会出现"买多了浪费、买少了不够用"的情况。官方虽然提供了四档选择,但对于用量在档位之间的用户来说,还是有点尴尬。
生态牌怎么打
小米这次降价,配合的是更大的生态动作。MiMo Orbit 计划分两部分:
百万亿 Token 创造者激励计划:虽然已经提前收官,但释放的信号很明确——小米愿意用真金白银换开发者。
Agent 生态共建计划:面向 Agent 框架团队提供 Token 限免支持,让用户免费接入 MiMo 系列模型。
第二个计划更值得关注。Agent 框架是大模型生态的关键一环,谁能拿下主流框架的默认集成,谁就能在开发者心智中占据一席之地。小米已经完成了 SGLang、vLLM 的适配,接下来如果能拿下 LangChain、LlamaIndex、AutoGPT 这些头部框架,生态护城河就算初步建立了。
另一个值得注意的是芯片厂商的站队。平头哥、AMD、燧原、亚马逊云科技都在第一时间完成了 MiMo-V2.5-Pro 的适配。这背后的逻辑是:大模型厂商需要多元化算力供应,芯片厂商需要标杆客户来证明自己的推理能力。双方各取所需,但最终受益的是整个国产算力生态。
写在最后
小米这次降价,表面上是价格战的又一轮升级,但往深了看,是在用成本优势倒逼行业重新思考大模型的商业化路径。
过去一年,大模型行业的主旋律是"能力竞赛"——谁的模型更强、谁的 benchmark 分数更高。但到了 2026 年,游戏规则变了。当主流模型的能力都到了"够用"这个阈值之后,开发者选型的第一考量因素就变成了成本和生态。
小米的打法是:用开源 + 低价 API 抢开发者,用 Token 效率优化留住开发者,用生态计划绑定开发者。这套组合拳能不能跑通,取决于两个变量:一是国产算力能不能撑住规模化推理的成本压力,二是小米能不能在开发者生态里建立起足够的粘性。
至少从现在看,小米在这场价格战里的姿态是认真的。降价不是促销,而是长期战略。接下来就看其他厂商怎么接招了。
参考来源
- 小米 MiMo-V2.5 系列 API 永久降价:降幅 57%-99%,当前有效 Token Plan 用户额度全量重置 - IT之家 - 官方降价公告及 Token Plan 调整细节
- 如何评价小米mimo-V2.5 系列模型5月27日大降价? - 知乎 - 开发者社区对降价的讨论和评价
- MIMO Max额度从16亿飙升至820亿 - Linux.do - Token Plan 额度调整的详细数据对比