小米 MiMo 套餐额度暴增 80 倍,Agent 模型价格战要来了?

产品更新

小米 MiMo Token Plan 再次更新,Credits 额度暴增 60-80 倍,相当于 API 价格降 99%。继 4 月百万亿 Token 免费计划后,小米 5 月再次大幅调整定价策略,引发行业对 Agent 模型价格战的担忧。

小米 MiMo 套餐额度暴增 80 倍,Agent 模型价格战要来了?

5 月 27 日,小米 MiMo Token Plan 再次更新,Lite 套餐的 Credits 额度从 6000 万直接跳到 41 亿,涨幅接近 70 倍。对已购套餐的用户来说,这相当于一夜之间 API 价格降了 99%。

这是小米两个月内第二次大规模调整定价策略。4 月底刚推出「百万亿 Token 免费送」计划,5 月又来这一手。加上梁圣 dsAgent 此前永久降价,开发者社区开始担心:国内这波卷法,会不会把国外模型也拖进价格战?

套餐额度暴增,但算法更复杂了

这次更新最直观的变化是数字:Lite 套餐从 6000 万 Credits 升到 41 亿,Max 套餐从 26 亿涨到 160 亿。按小米官方换算规则,MiMo-V2-Pro 消耗 1 Token 等于 2 Credits,Max 档 160 亿 Credits 理论上能调用 80 亿 Token。

但实际可用量远没这么简单。小米的 Credit 倍率机制比较复杂:Pro 模型基础倍率是 1 Token = 2 Credits,超过 256K 上下文窗口则变成 4 Credits。Agent 框架大量使用缓存 Token 时,实际消耗速度会更快。有开发者在社区反馈,入门套餐的真实可用量可能只有字面数字的三分之一。

小米 MiMo Token Plan 套餐对比表格,展示不同档位的 Credits 额度变化

小米官方对 Credits 折算逻辑一直没有完整公开。腾讯科技此前向小米求证「Credits 如何折算为不同模型、不同上下文长度下的真实 Token 使用量」,截至发稿未得到回应。这种不透明的计费方式,让部分开发者对「降价 99%」的说法持保留态度。

罗福莉的警告:别掉进 Anthropic 踩过的坑

小米大模型负责人罗福莉在 4 月的一篇长文中,直接点名了 Anthropic 的订阅制困境。

Claude 的订阅制(Pro 20 美元/月,Max 100-200 美元/月)原本是为个人用户设计的,但 OpenClaw 等 Agent 框架的调用模式完全不同:单个用户查询会触发多轮独立 API 请求,每个请求都包含超过 10 万 Token 的上下文窗口。即使命中缓存,这也是一种浪费。极端情况下,用户付 200 美元,却用掉了几千美元的计算资源。

罗福莉的判断是:固定月费无法覆盖 Agent 场景下的实际算力消耗。 Anthropic 最终选择禁止 Claude Pro 和 Max 订阅用户通过第三方 Agent 框架调用,本质上是在保护自家 Claude Code 的护城河。

MiMo Token Plan 的设计逻辑不同。它支持第三方框架接入,但按 Token 配额计费,用多少付多少。罗福莉说:「我们的目标是长期稳定地交付高质量的模型和服务,而不是让你冲动付费后就弃用。」

她还扮演了一次行业定价的「吹哨人」角色:「我建议 LLM 公司在弄清楚如何在不造成资金流失的情况下为 Coding 方案定价之前,不要盲目地竞相压低价格。以极低的价格出售 Token,同时对第三方敞开大门,这看起来对用户很有吸引力,但这却是一个陷阱——Anthropic 刚刚摆脱的那个陷阱。」

这篇帖子浏览量超过 71 万,引发了大量讨论。有开发者认同她对 OpenClaw 上下文管理低效的判断,也有人指出小米自己的 Credit 换算机制同样不够透明。

免费到付费的转换率,才是真正的考验

小米在 OpenRouter 上的数据很能说明问题。

免费推广期间,MiMo-V2-Pro 单周 Token 消耗量突破 4 万亿,日榜、周榜、月榜均排名第一,编程领域市占率一度超过 30%。但免费期结束后,周调用量从高峰明显下滑。

OpenRouter 上的规律比较直接:在达到一定性能阈值后,谁便宜或免费,谁就有可能冲到榜一。排名证明了模型能力和可用性,但调用量受是否免费的影响巨大。

MiMo-V2-Pro 在 OpenRouter 上的调用量趋势图,标注免费期结束时间点

从免费到付费的转换率,是所有大模型公司面临的共同难题。小米这次大幅提升套餐额度,本质上是在用「准免费」的方式延长用户留存窗口。但这能换来多少真正愿意长期付费的用户,还需要时间验证。

开发者社区的反馈也比较分裂。有用户表示「雷总大气,我要站起来蹬」,也有人反馈 MiMo-V2-Pro 在复杂推理上偶尔出现「无限循环」,以及内容审核系统误拦截正常 API 调用的问题。

小米是唯一还在做基座大模型的手机厂商

从行业横向对比来看,小米的选择是孤独的。

华为盘古大模型主要通过鸿蒙系统实现端云协同,vivo 蓝心大模型服务于 OriginOS 的 AI 助手,OPPO 安第斯大模型升级了小布助手,荣耀走 AI 终端生态路线。这些厂商的大模型都是「AI 服务于手机」,没有一家独立运营 API 平台或对外售卖模型订阅。 包括苹果、三星在内的全球手机巨头,也没有对外直接提供服务的基座大模型。

vivo 副总裁周围的公开表态也许可以代表多数厂商的态度:未来手机可能进化为「智能体」,但实现路径不一定需要自研基座模型,接入第三方大模型同样可以。

小米的逻辑不同。据接近小米的人士透露,小米内部开始认为「大模型是未来科技公司必须要有的能力。小米未来所有产品端的能力,需要有一个主模型去控制、去培养、去指导。这个主模型必须是自己的。因为只有自己拥有,才能决定你的用户习惯、你的输入数据不交给第三方。」

手机、汽车、IoT 设备产生的海量用户数据是最核心的资产,如果基座模型依赖第三方,数据主权和产品迭代节奏都将受制于人。

从组织架构看,大模型 Core 团队归属小米集团技术委员会,不隶属于手机部或汽车部。小米副总裁曲恒负责管理这条线,但罗福莉拥有很高的独立性,她加入后按照自己的想法组建了团队,核心成员平均年龄 25 岁,清北毕业生占比超六成。

研发投入规模也在快速攀升。小米 2025 年全年研发开支 331 亿元,同比增长 37.8%,接近全年经调整净利润 392 亿元。据小米总裁卢伟冰在业绩会上的表述,AI 投入约占研发总额的四分之一。

雷军在 MiMo-V2-Pro 发布当天宣布,2026 年小米在 AI 领域的研发和资本投入将超过 160 亿元,未来三年至少 600 亿元。算力上,小米采取自建万卡 GPU 集群加金山云合作的混合模式。

价格战会不会打起来?

回到最初的问题:小米这波操作,会不会引发 Agent 模型价格战?

从目前的信号看,可能性不小。

梁圣 dsAgent 此前永久降价时,minimax 的股票跌了不少。但这次小米 MiMo 跟进后,GLM 和 minimax 的股票反而在大涨。有开发者在社区讨论:「模型定位跟 minimax 也有重叠,怎么这两家股票还在大涨?」

一个可能的解释是:市场开始意识到,价格战不一定是坏事。低价能快速扩大用户基数,只要转换率和留存率能跟上,长期来看反而有利于头部玩家建立护城河。

但罗福莉的警告也不是没有道理。如果所有厂商都盲目跟进低价策略,最终可能陷入「薅羊毛式」的成本倒挂。Anthropic 的教训就在眼前:订阅制看起来对用户友好,但如果算不清账,最后只能通过限制使用场景来止损。

小米的 Token Plan 试图在「低价」和「可持续」之间找到平衡点。按 Token 配额计费,支持第三方框架接入,不设 5 小时使用限额,这些设计都在向「用多少付多少」的方向靠拢。但 Credit 倍率机制的不透明,以及免费到付费转换率的不确定性,仍然是两个待解的问题。

大模型会成为小米的又一条主线业务吗?

从种种公开信息来看,大模型之于小米集团,正在发生一些微妙但关键的变化:它不只是一个服务于手机和 IoT 的底层能力,开始具备向一条独立业务线演进的结构性条件。

最直观的信号,是产品形态的变化。小米已经推出了面向开发者的 API 平台,并配套提供分层的 Token 订阅方案。无论规模大小,这一步本身,就已经越过了传统「技术中台」的边界。

雷军曾在公开场合明确提出,小米计划在 2026 年实现一次关键性的技术整合:在一款终端产品中,让自研芯片、操作系统与 AI 大模型完成协同落地。至今为止,能同时覆盖这三层能力的公司并不多。华为通过麒麟芯片、鸿蒙系统与盘古模型,已经形成过相对完整的技术闭环;苹果公司则长期在芯片与操作系统上建立深度一体化,并正在强化其端侧 AI 能力。

根据披露,小米将 AI 相关业务与智能电动汽车一同归入「创新业务」板块。2025 年,该板块收入为 1061 亿元,其中汽车贡献了约 1033 亿元,AI 相关收入尚未被单独披露。产品和形态已经在向独立业务靠拢,但公开财务信息上还未完成验证。

当小米将高阶订阅方案定在与 Claude 相近的区间,并开始质疑行业普遍推行的订阅制的时候,目的可能未必在于「价格竞争」。通过锚定头部模型,主动进入同一层级的市场叙事,证明「上桌的能力」可能更为重要。

从 2023 年 5 月「小米不会做 ChatGPT」,到 2026 年 5 月套餐额度暴增 80 倍,小米在大模型上的态度转变,比很多人想象的要快。这次更新会不会引发价格战,还需要观察其他厂商的反应。但有一点可以确定:Agent 模型的定价逻辑,正在被重新定义。


参考来源