小米 MiMo-V2.5 系列 API 今日永久降价，最高降幅达 99%，同时 Token Plan 套餐额度从 16 亿飙升至 820 亿 Credits，实际可用量提升 5-8 倍。

小米 MiMo-V2.5 API 降价 99%，Token Plan 额度暴涨 51 倍

5 月 27 日凌晨，小米 MiMo 官方宣布对整个模型价格体系进行永久性调整。MiMo-V2.5 系列 API 最高降幅达 99%，Token Plan 套餐额度从原来的 16 亿 Credits 提升至 820 亿 Credits，所有在有效期内的订阅用户额度全量重置。这是继 DeepSeek 之后，中国大模型厂商在价格战中的又一次激进出手。

降价逻辑：99% 是怎么算出来的

官方口径里的"最高降幅 99%"主要针对缓存输入场景。新定价不再区分 256k 和 1M 上下文窗口长度，统一按新的 Credits 消耗规则计费：

MiMo-V2.5：输入 100 Credits/token，输出 200 Credits/token
MiMo-V2.5-Pro：输入 300 Credits/token，输出 600 Credits/token

对比此前 1 Token = 4 Credits 且区分窗口长度的复杂计费方式，新规则确实简化了不少。但这里有个关键点：套餐额度虽然从数字上涨了 51 倍（Max 档从 16 亿涨到 820 亿），但每次调用消耗的 Credits 也同步上调了。官方给出的实际口径是可用量提升 5-8 倍，而非 51 倍。

这种"数字膨胀"的操作在云服务定价里并不罕见。本质上是把计费单位重新标定，让用户感知到"额度变大了"，但实际购买力的提升幅度要打个折扣。不过即便按 5-8 倍算，对于重度用户来说也是实打实的成本下降。

小米 MiMo Token Plan 套餐额度对比表，展示 Lite/Standard/Pro/Max 四档从旧版到新版的额度变化

Token Plan 四档全面升级

具体到各档位，新版 Token Plan 的 Credits 额度调整如下：

档位	旧版额度	新版额度	涨幅
Lite	0.6 亿	41 亿	68 倍
Standard	2 亿	110 亿	55 倍
Pro	7 亿	380 亿	54 倍
Max	16 亿	820 亿	51 倍

所有已订阅且仍在有效期内的用户，无论当前用量如何，额度将于 5 月 27 日 0:00 全量重置为新标准。这意味着如果你上个月刚买了 Max 档还没用完，现在直接给你重置成 820 亿 Credits，相当于白送了一大笔额度。

官方还特别提到，针对 Token Plan 已过期的历史付费用户，也准备了"惊喜好礼"，将在未来一周公布。这种对老用户的补偿姿态，在国内大模型厂商里算是比较少见的。

夜间 8 折 + 包年 88 折，小米在学谁

除了额度调整，Token Plan 还新增了两个定价策略：

夜间专属优惠：每天 00:00-08:00，所有模型 Credits 消耗速率在原有基础上再打 8 折。这个设计明显是在引导用户错峰使用，降低高峰时段的推理压力。
包年订阅折扣：一次性订阅全年享 88 折，最高可减 948.96 元。连续包月模式下，老用户次月 7 折，新用户次月 77 折。

这套组合拳的逻辑很清晰：用价格杠杆调节用户行为，同时通过长周期订阅锁定用户。夜间 8 折的设计在云计算领域早有先例（AWS、阿里云都有类似的"闲时折扣"），但在大模型 API 定价里还不多见。

值得注意的是，小米这次取消了此前饱受吐槽的"1 Token = 4 Credits"计费方式，改为直接按 Token 消耗倍率计费。这种简化对开发者更友好，不用再去算复杂的换算关系。

百万亿 Token 计划提前收官

小米在 4 月底启动的"百万亿 Token 创造者激励计划"原定 30 天发放 100T Tokens，结果在 5 月 26 日 16:08 就提前发完了。这个速度说明两件事：一是小米在推广上确实舍得砸钱，二是开发者对免费额度的需求远超预期。

这个计划采取申请制，通过审核的用户最高可获得 Max 档 Token Plan（价值 659 元）。虽然活动已经结束，但 Apache 软件基金会成员的专属福利仍然长期有效。这种针对开源社区的定向支持，是小米在生态建设上的一个长线投入。

价格战的终局是什么

小米这次降价，放在更大的背景下看，是中国大模型厂商集体向成本要效率的一个缩影。DeepSeek 在今年初把推理成本打到了一个新低点，逼得 OpenAI、Anthropic 这些美国厂商也不得不跟进降价。但中美两边的降价逻辑不太一样：

美国厂商：降价是为了守住市场份额，但核心还是要保证利润率。所以你会看到 OpenAI 降价的同时，也在推更贵的企业版、更高级的订阅计划。
中国厂商：降价是为了抢开发者生态。现阶段利润不是第一优先级，先把用户规模做起来，再考虑商业化路径。

小米的打法更接近后者。MiMo-V2.5 系列在 4 月底开源时就采用了宽松的 MIT 协议，允许自由商用、二次训练，不需要额外授权。这种"开源 + 低价 API"的组合，目标很明确：让开发者用起来没有心理负担，先把生态做起来。

但这种"零利润率"的竞赛能持续多久？Hacker News 上有开发者质疑，这些受限于芯片供应的公司，如何在缺乏顶级 H100 或 Blackwell 硬件的情况下维持推理能力。小米的答案可能是 SGLang 这类推理优化技术。官方提到 MiMo-V2.5 系列已完成 SGLang 和 vLLM 的 Day-0 适配，并且在平头哥真武 810E、AMD ROCm、燧原 L600 等国产芯片上都跑通了。

换句话说，小米在用软件优化 + 国产算力的组合，绕开对英伟达高端芯片的依赖。这条路能不能走通，直接决定了这场价格战的可持续性。

Token 效率：比 Kimi K2.6 省 42%

降价之外,小米这次还重点强调了 Token 效率。官方数据显示：

MiMo-V2.5-Pro 在达到与 Kimi K2.6 相同的 ClawEval 分数时，节省了 42% Token
MiMo-V2.5 在达到与 Meta Muse Spark 相同分数时，节省了 50% Token

Token 效率这个指标在 Agent 场景下尤其重要。因为 Agent 任务往往涉及大量工具调用、多轮对话、长上下文处理，Token 消耗是成本的大头。如果能在保证性能的前提下减少 Token 消耗,对开发者来说就是真金白银的节省。

小米在 4 月发布 MiMo-V2.5 系列时,就展示了几个极端案例：

SysY 编译器任务：4.3 小时、672 次工具调用,完成北大本科生需要数周才能搞定的编译原理课程项目
视频编辑器开发：11.5 小时、1868 次工具调用,交付 8192 行代码的完整 Web 应用
模拟电路 EDA 设计：1 小时闭环迭代,完成经验丰富的工程师需要数天的 FVF-LDO 设计

这些案例的共同点是：任务复杂度高、工具调用次数多、上下文窗口长。在这种场景下,Token 效率的提升直接转化为成本优势。

对开发者意味着什么

从开发者视角看,这次调价有几个实际影响：

成本可预测性更强：取消复杂的倍率计费,改为统一的 Credits 消耗规则,开发者更容易估算成本。
长周期任务更划算：夜间 8 折 + 包年 88 折的组合,对跑批处理、数据标注、模型微调这类非实时任务很友好。
Agent 开发门槛降低：Token 效率提升 + API 降价,让原本因为成本问题搁置的 Agent 项目变得可行。
多模态能力下放：MiMo-V2.5 支持原生全模态（图像、音频、视频),且 API 成本比上一代降低 50%,这意味着多模态 Agent 不再是大厂专属。

但也有需要注意的点：小米的 Token Plan 是订阅制,不是按量付费。如果你的用量波动很大,可能会出现"买多了浪费、买少了不够用"的情况。官方虽然提供了四档选择,但对于用量在档位之间的用户来说,还是有点尴尬。

生态牌怎么打

小米这次降价,配合的是更大的生态动作。MiMo Orbit 计划分两部分：

百万亿 Token 创造者激励计划：虽然已经提前收官,但释放的信号很明确——小米愿意用真金白银换开发者。
Agent 生态共建计划：面向 Agent 框架团队提供 Token 限免支持,让用户免费接入 MiMo 系列模型。

第二个计划更值得关注。Agent 框架是大模型生态的关键一环,谁能拿下主流框架的默认集成,谁就能在开发者心智中占据一席之地。小米已经完成了 SGLang、vLLM 的适配,接下来如果能拿下 LangChain、LlamaIndex、AutoGPT 这些头部框架,生态护城河就算初步建立了。

另一个值得注意的是芯片厂商的站队。平头哥、AMD、燧原、亚马逊云科技都在第一时间完成了 MiMo-V2.5-Pro 的适配。这背后的逻辑是：大模型厂商需要多元化算力供应,芯片厂商需要标杆客户来证明自己的推理能力。双方各取所需,但最终受益的是整个国产算力生态。

写在最后

小米这次降价,表面上是价格战的又一轮升级,但往深了看,是在用成本优势倒逼行业重新思考大模型的商业化路径。

过去一年,大模型行业的主旋律是"能力竞赛"——谁的模型更强、谁的 benchmark 分数更高。但到了 2026 年,游戏规则变了。当主流模型的能力都到了"够用"这个阈值之后,开发者选型的第一考量因素就变成了成本和生态。

小米的打法是：用开源 + 低价 API 抢开发者,用 Token 效率优化留住开发者,用生态计划绑定开发者。这套组合拳能不能跑通,取决于两个变量：一是国产算力能不能撑住规模化推理的成本压力,二是小米能不能在开发者生态里建立起足够的粘性。

至少从现在看,小米在这场价格战里的姿态是认真的。降价不是促销,而是长期战略。接下来就看其他厂商怎么接招了。

参考来源

小米 MiMo-V2.5 系列 API 永久降价：降幅 57%-99%，当前有效 Token Plan 用户额度全量重置 - IT之家 - 官方降价公告及 Token Plan 调整细节
如何评价小米mimo-V2.5 系列模型5月27日大降价？ - 知乎 - 开发者社区对降价的讨论和评价
MIMO Max额度从16亿飙升至820亿 - Linux.do - Token Plan 额度调整的详细数据对比