小米 MiMo-V2.5 API 降价 99%,存量用户额度全部重置

产品更新

小米 MiMo-V2.5 系列 API 今日大幅调价,最高降幅 99%,同时对所有有效期内的 Token Plan 用户进行额度重置,用量可提升 5-8 倍。

小米 MiMo-V2.5 API 降价 99%,存量用户额度全部重置

小米今天对 MiMo-V2.5 系列模型 API 进行了一次激进的价格调整。MiMo-V2.5-Pro 输入价格从 ¥300/百万 tokens 降至 ¥3,降幅 99%;MiMo-V2.5 输入价格从 ¥100/百万 tokens 降至 ¥1,同样是 99% 的降幅。更关键的是,小米同步对所有仍在有效期内的 Token Plan 用户进行了额度重置——无论当前套餐已经用了多少,Credits 直接清零重新计算,有效期不变。

这次调价的力度和节奏都不太寻常。MiMo-V2.5 系列刚在今年 4 月发布,当时小米对标的是 Claude Opus 4.6 和 GPT-5.4,定位是「为长难 Agent 任务而生」的旗舰模型。发布时的定价策略相对保守,Token Plan 采用 1 Token = 4 Credits 的计费方式,还区分 256k 和 1M 上下文窗口的倍率。不少开发者当时就吐槽价格偏高,便宜套餐的 Token 不够用。

现在小米直接把价格打到地板价,同时把计费逻辑简化:取消 4 倍 Credits 计费,不再区分上下文窗口长度,MiMo-V2.5 按 1:1 计费(1 Token = 1 Credit),MiMo-V2.5-Pro 按 1:2 计费。这意味着即使不考虑降价,单纯因为计费方式调整,用户的实际可用量就已经翻了 4 倍。再加上价格本身的 99% 降幅,综合下来,同样的钱能调用的 tokens 数是之前的几十倍。

小米 MiMo-V2.5 系列新旧价格对比表

额度重置:已购用户直接受益

更值得关注的是额度重置政策。小米这次不是只对新购用户生效,而是把所有仍在有效期内的 Token Plan——包括参与「百万亿 Token 创造者激励计划」获得的套餐,以及 Apache 软件基金会专属福利——全部重置 Credits 消耗记录。

举个例子:如果你在 4 月买了一个年付套餐,到现在已经用掉了 80% 的额度,按照新规则,这 80% 的消耗直接清零,你的套餐又是满额状态,而且因为计费方式优化,这个「满额」对应的实际可用 tokens 数比你当初购买时多了 5-8 倍。有效期还是原来的有效期,不会因为重置而缩短。

这种操作在 API 服务商里不常见。通常的做法是降价只对新购生效,老用户要么等套餐到期后按新价续费,要么自认倒霉。小米这次选择让存量用户直接受益,从商业角度看是在用短期收入损失换用户粘性和口碑。

社区反应很直接。Linux.do 论坛上有用户发帖说「根本用不完」,还有人调侃「小米这是在发福利」。从帖子时间线看,消息是在今天下午开始大规模传播的,官方公告应该是在中午前后发出。

夜间时段再打 8 折

除了降价和重置,小米还新增了夜间优惠时段:每天 00:00 - 08:00,所有模型的 Credits 消耗速率在现有基础上再打 8 折。也就是说,如果你在凌晨调用 MiMo-V2.5-Pro,实际消耗是 1 Token = 1.6 Credits,而不是白天的 2 Credits。

这个设计明显是在引导用户错峰使用,降低高峰时段的推理压力。对于跑批处理任务、数据标注、离线分析这类对实时性要求不高的场景,夜间时段的性价比会非常高。

小米还上线了连续包月和包年订阅模式。老用户开通自动续费享次月 7 折,新用户享 77 折;包年订阅一次性付费享全年 88 折,最高可减 948.96 元。这套组合拳下来,如果你是重度用户,选择包年 + 夜间调用,成本能压到一个相当低的水平。

MiMo-V2.5 系列的实际能力

价格是一方面,模型本身的能力才是核心。MiMo-V2.5 系列在 4 月发布时,小米给出的定位是「对标全球顶尖 Agent 模型」。从公开的评测数据看,MiMo-V2.5-Pro 在 Claw-Eval 等 Agent 基准测试中的表现确实不错,但跟 Claude Opus 4.6、GPT-5.4 还是有差距。

小米强调的一个点是 Token 效率。官方数据显示,在达到相同 Claw-Eval 分数的情况下,MiMo-V2.5-Pro 比 Kimi K2.6 节省 42% Token,MiMo-V2.5 比 Muse Spark 节省 50% Token。这个优势在长上下文、多轮对话场景下会比较明显,尤其是对成本敏感的应用。

MiMo-V2.5-Pro 支持近千轮工具调用的长程任务,这在复杂的软件工程、数据分析、自动化流程中有实际价值。小米给出的案例包括用 Rust 实现完整的 SysY 编译器(4.3 小时完成,北大本科生通常需要数周)、开发视频编辑器 Web 应用(8192 行代码,11.5 小时)、设计模拟电路 EDA(1 小时完成经验丰富工程师需要数天的任务)。

这些案例的可信度需要打个问号。AI 生成的代码能跑通测试是一回事,能不能用在生产环境是另一回事。但至少说明 MiMo-V2.5-Pro 在处理长链推理、工具调用、多任务协同上有一定能力,不是纯粹的 PPT 模型。

MiMo-V2.5 是全模态模型,支持图像、音频、视频输入。在 VideoMME、CharXiv、MMMU-Pro 等多模态评测中,表现逼近甚至超越了 Claude Opus 4.6、Gemini 3 Pro、GPT-5.4。这个「逼近甚至超越」的表述比较模糊,但考虑到 MiMo-V2.5 的定价,如果多模态能力确实能打,性价比会很有竞争力。

开源承诺兑现了一半

小米在 4 月发布 MiMo-V2.5 系列时承诺会全球开源。5 月初,MiMo-V2.5-Pro 和 MiMo-V2.5 确实开源了,同时推出了「MiMo Orbit 百万亿 Token 创造者激励计划」,30 天内发放 100 万亿免费 Token。

开源版本完成了与 AWS、阿里平头哥、AMD、百度昆仑芯、燧原科技、沐曦、天数智芯等芯片厂商的适配,也支持 SGLang 和 vLLM 两大主流推理框架。从社区反馈看,部署和推理的体验还可以,但跟 Llama、Qwen 这些成熟开源模型比,生态还差一截。

开源对小米来说是双刃剑。一方面能快速扩大开发者生态,吸引更多人基于 MiMo 做二次开发和应用;另一方面,开源版本的存在会分流 API 调用量,尤其是对成本敏感、有自建推理能力的团队。小米这次大幅降价,某种程度上也是在跟自己的开源版本竞争——如果 API 价格足够低,很多团队就不会费劲去自己部署了。

这次降价的逻辑

小米为什么在这个时间点降价?有几个可能的原因:

推理成本下降。 MiMo-V2.5 系列发布两个月,推理优化、模型蒸馏、硬件适配都在持续进行。如果推理成本降到了一个新的台阶,降价就有了空间。小米自己有芯片业务,在算力成本控制上可能比纯 API 服务商更有优势。

用户增长遇到瓶颈。 MiMo-V2.5 发布时定价偏高,开发者尝鲜之后,续费率可能不理想。降价是最直接的刺激手段,尤其是配合额度重置,能快速激活存量用户,同时吸引新用户。

竞争压力。 DeepSeek、Kimi、智谱、月之暗面这些国内玩家都在打价格战,OpenAI 和 Anthropic 也在不断优化定价策略。小米如果不跟进,MiMo 很容易被边缘化。

为硬件生态铺路。 小米的终极目标不是卖 API,而是把 AI 能力嵌入到手机、汽车、IoT 设备里,打造「人车家全场景 AI」。API 降价能快速积累用户和数据,反哺模型迭代,最终服务于硬件生态。

从这个角度看,小米这次降价不是单纯的价格战,而是在为更大的战略布局做准备。MiMo-V2.5 系列的 API 调用量上去了,开发者生态起来了,后续在小米设备上落地 AI 应用就会更顺畅。

对开发者的影响

对于已经在用 MiMo API 的开发者,这次调整是纯利好。成本大幅下降,可用量大幅提升,原来因为预算限制不敢尝试的场景现在可以放开跑了。

对于还在观望的开发者,MiMo-V2.5 系列现在的性价比值得认真考虑。如果你的应用场景对 Agent 能力、长上下文、多模态有需求,而且对成本敏感,MiMo-V2.5 可能是个不错的选择。当然,前提是你能接受一个相对年轻的模型生态,以及可能存在的稳定性和兼容性问题。

小米还预告了针对 Token Plan 已过期的历史付费用户的「惊喜好礼」,会在未来一周宣布。从这次调整的力度看,这个「惊喜」应该不会太小。

价格战的尽头

MiMo-V2.5 这次降价,再次印证了一个趋势:大模型 API 的价格战远没有结束。从 GPT-3.5 到 GPT-4,从 Claude 2 到 Claude 3,从 Llama 2 到 Llama 3,每一代模型的推理成本都在快速下降,价格也在不断下探。

这对开发者是好事,对模型厂商是挑战。价格战的尽头,要么是头部玩家通过规模效应和技术优势建立护城河,把小玩家挤出市场;要么是大家都卷到无利可图,转而在垂直场景、企业服务、硬件集成上找新的增长点。

小米选择的是后者。MiMo API 不是小米的核心业务,而是为硬件生态服务的基础设施。只要 API 能帮小米在 AI 时代站稳脚跟,短期的收入损失是可以接受的。

从这个角度看,小米这次降价不只是一个产品策略调整,而是在为未来的 AI 生态布局下注。至于这个赌注能不能赢,还得看 MiMo 后续的迭代速度、生态建设,以及小米在硬件端的 AI 落地能力。


参考来源