小米发布 2026 年 Q1 财报，基座大模型 MiMo-V2.5-Pro 在 Artificial Analysis 智能指数与 Agent 指数双榜登顶全球开源模型第一，同时在 OpenRouter 平台周调用量达 4.82 万亿 Token，终结 Minimax 连续榜首纪录。

小米 MiMo-V2.5-Pro 登顶全球开源榜首

小米今天（5 月 26 日）发布的 2026 年第一季度财报里，藏着一个更值得关注的信号：它的基座大模型 MiMo-V2.5-Pro 在 Artificial Analysis 的智能指数和 Agent 指数双榜上，拿下了全球开源模型并列第一。

这不是小米第一次在 AI 上砸钱——财报显示，Q1 研发投入 90 亿元，同比增长 33.4%，今年 AI 领域至少投入 160 亿元，未来三年超 600 亿元。但这次不一样的是，钱砸出了实打实的排名。

MiMo-V2.5-Pro 在 Artificial Analysis 榜单截图

双榜登顶，但更关键的是 Agent 能力

Artificial Analysis 是业内公认比较硬的第三方评测平台，它的智能指数综合了推理、代码、数学等多维度能力，Agent 指数则专门衡量模型在复杂任务中的自主决策和工具调用能力。MiMo-V2.5-Pro 能在这两个榜上同时登顶，说明它不是靠某个单项刷分上来的。

对比一下就知道这个位置有多难拿：Claude Opus 4.6、GPT-5.4 这些闭源顶模在 Agent 能力上一直是标杆，开源模型要追上它们，不只是参数量和训练数据的问题，更考验模型架构设计和对齐策略。小米这次能跟它们「坐在一张桌子上吃饭」，至少证明国产开源模型在 Agent 这条赛道上已经不是陪跑了。

更直接的验证来自 OpenRouter 平台的数据：MiMo-V2-Pro（注意这里是 V2-Pro，不是最新的 V2.5-Pro）在同一周以 30%+ 的市占率登顶周榜第一,周调用量达到 4.82 万亿 Token，终结了 Minimax 的连续榜首纪录。这个调用量不是刷出来的——开发者用脚投票,选的是真正能干活的模型。

MiMo-V2.5 系列：四款模型,两条路线

小米这次发布的 MiMo-V2.5 系列包含四款模型：

MiMo-V2.5-Pro：旗舰模型,主打通用智能体能力、复杂软件工程和长程任务,对标 Claude Opus 4.6 和 GPT-5.4
MiMo-V2.5：原生多模态模型,支持视觉和音频理解,在智能体性能上超越上一代 MiMo-V2-Pro,支持 100 万 Token 上下文
MiMo-V2.5-TTS Series：语音合成模型
MiMo-V2.5-ASR：语音识别模型

其中 MiMo-V2.5-Pro 和 MiMo-V2.5 已经全球开源。这个开源策略值得说一下：小米没有像很多厂商那样只开源「阉割版」,而是把最强的 Pro 版本直接放出来。这要么是真的有信心,要么是想通过开源快速占领开发者生态——从目前的调用量数据看,后者的效果已经显现了。

技术细节：省 Token 就是省钱

MiMo-V2.5-Pro 相比月之暗面的 Kimi K2.6 节省了 42% Token,MiMo-V2.5 相比 Meta 的 Muse Spark 节省 50% Token。这个数据看起来是技术指标,但对开发者来说就是真金白银。

举个例子：如果你用 MiMo-V2.5-Pro 处理一个 100 万 Token 的长文档分析任务,相比 Kimi K2.6 能省下 42 万 Token 的成本。按照目前主流 API 的定价（输入 Token 大约 0.01-0.03 元/千 Token）,单次任务就能省几块到十几块钱。对于高频调用的企业应用来说,一个月下来省的钱可能比模型本身的订阅费还多。

这背后是模型压缩和推理优化技术的进步。小米没有公开具体的技术细节,但从结果推测,可能在以下几个方向做了工作：

更高效的 Tokenizer：通过改进分词算法,用更少的 Token 表达相同的语义
动态上下文裁剪：在保证任务完成质量的前提下,智能识别并丢弃冗余上下文
推理时优化：通过 KV Cache 复用、Speculative Decoding 等技术减少实际计算量

定价调整：取消复杂计费,直接降价

小米同时调整了 MiMo Token Plan 的计费方式：

取消「1 Token = 4 Credits」的换算,直接按 Token 计费
不再区分 256k 和 1M 上下文窗口的 Credit 倍率
连续月费订阅：现有用户开通自动续费后次月 7 折,新用户次月 77 折
年费订阅：一次性订阅全年 88 折,最高可减 948.96 元

这个调整看起来是简化计费,实际上是在降价。之前很多用户抱怨大模型的计费方式太复杂——不同上下文长度不同价格、输入输出 Token 分开计费、还要换算成 Credits——现在直接按 Token 算,开发者能更清楚地预估成本。

对比一下主流模型的定价（以 100 万 Token 输入为例）：

GPT-5.4：约 30-50 元（根据上下文长度浮动）
Claude Opus 4.6：约 45-60 元
Kimi K2.6：约 20-35 元
MiMo-V2.5-Pro：约 15-25 元（开源版本免费,API 调用收费）

小米的定价策略很明确：用价格优势抢市场份额。这在开源模型里是常见打法,但能做到性能不输闭源顶模的同时还便宜一半,就不只是价格战了。

罗福莉和她的 36 天迭代周期

值得一提的是,MiMo 大模型的负责人罗福莉是 DeepSeek 前核心成员,业内称她为「天才少女」。从上次发布 MiMo-V2 系列到这次 V2.5 系列,只过了 36 天。

这个迭代速度在大模型领域算是非常激进的。通常来说,一个主版本的迭代周期至少要 2-3 个月,因为需要重新训练、对齐、评测、修 bug。36 天能出一个新版本,要么是团队规模和算力投入足够大,要么是在架构设计上做了模块化,可以快速替换和升级某些组件。

罗福莉之前说过,「当未来模型足够稳定后将会开源」。现在 MiMo-V2.5-Pro 开源了,说明小米认为这个版本已经达到了可以大规模使用的稳定性。这对开发者来说是好消息——不用担心用着用着模型就不维护了。

MiMo-V2.5 的多模态能力：不只是看图说话

MiMo-V2.5（非 Pro 版本）主打原生多模态能力,支持视觉和音频理解。这里的「原生」很关键——不是把图像编码器和语言模型拼起来,而是从预训练阶段就让模型学会跨模态推理。

具体来说,MiMo-V2.5 能做到：

视觉理解：不只是识别图片里有什么,还能理解图片中的空间关系、因果关系、时间序列（比如看一组连续截图推断操作流程）
音频理解：识别语音内容、说话人情绪、背景音效,甚至能根据音频推断场景（比如听到键盘声和鼠标点击声,推断用户在编程）
跨模态推理：给一张产品设计图和一段用户反馈录音,模型能综合两者给出改进建议

这种能力在 Agent 场景下特别有用。比如你让 Agent 帮你调试一个前端页面,它不仅能看代码,还能看浏览器截图,理解实际渲染效果和预期效果的差异,然后给出修改方案。这比纯文本交互的模型要高效得多。

中国模型的调用量已经连续五周超过美国

OpenRouter 平台的数据显示,中国模型的总调用量已经连续五周超过美国。这个趋势在今年 Q1 开始显现,到现在已经比较稳定了。

背后的原因有几个：

性价比优势：中国模型普遍比美国模型便宜 30-50%,在性能接近的情况下,开发者自然选便宜的
本地化支持：中文理解、中国特色场景（比如电商、短视频、社交媒体）的处理能力更强
API 稳定性：国内模型的 API 服务在中国大陆的访问速度和稳定性明显好于海外服务
合规性：对于需要数据本地化存储的企业应用,用国内模型更容易满足合规要求

小米 MiMo 系列在这个趋势中扮演了重要角色。从 MiMo-V2-Pro 登顶 OpenRouter 周榜就能看出,它不是靠低价倾销抢市场,而是真的有开发者愿意用、用得好。

Hermes Agent：第一贡献模型

财报里还提到,Xiaomi MiMo 大模型助力 Hermes Agent 登顶全球调用量榜首,成为第一贡献模型。Hermes Agent 是一个开源的 AI Agent 框架,支持多模型接入,开发者可以用它快速搭建自己的 Agent 应用。

MiMo 能成为 Hermes Agent 的第一贡献模型,说明两件事：

Agent 能力确实强：Hermes Agent 的开发者和用户选择 MiMo,是因为它在实际任务中的表现最好
生态整合能力：小米不只是做模型,还在积极参与开源生态,跟主流 Agent 框架深度整合

这对小米来说是个正向循环：模型好 → 开发者用 → 反馈数据多 → 模型迭代快 → 模型更好。DeepSeek 就是靠这个循环起来的,小米现在也在走这条路。

开源模型的商业化困境

小米这次开源 MiMo-V2.5-Pro,看起来很大方,但开源模型的商业化一直是个难题。Meta 开源 Llama 系列,主要是为了推广自己的 AI 基础设施和开发工具；Mistral 开源模型,但核心收入来自企业定制服务和私有部署。

小米的商业化路径可能有几个方向：

API 服务：开源模型免费,但 API 调用收费。这是最直接的变现方式,也是目前主流做法
硬件绑定：在小米手机、IoT 设备上预装 MiMo 模型,提供端侧 AI 能力。这能增强硬件产品的竞争力
企业服务：为企业提供私有部署、模型微调、定制开发等服务。这块的利润率比 API 服务高得多
生态分成：通过 MiMo 模型构建的应用生态,小米可以从中抽成（类似苹果 App Store 的模式）

从财报披露的「未来三年 AI 投入超 600 亿元」来看,小米短期内不指望 AI 业务盈利,更多是在抢占市场份额和技术高地。这个打法跟当年小米做手机时的「硬件不赚钱,靠服务和生态赚钱」如出一辙。

对开发者意味着什么

如果你是开发者,MiMo-V2.5-Pro 登顶这件事对你有几个实际影响：

多了一个靠谱的开源选择：之前开源模型里能打的不多,Llama 3.3、Qwen 2.5、DeepSeek-V3 算是第一梯队,现在 MiMo-V2.5-Pro 也进来了
Agent 应用的成本降低了：如果你在做 Agent 相关的项目,MiMo-V2.5-Pro 的性价比值得考虑。尤其是需要长上下文和复杂推理的场景
多模态能力更容易获取：MiMo-V2.5 的原生多模态能力,比自己拼接图像模型和语言模型要省事得多
国内 API 服务更稳定：如果你的用户主要在中国大陆,用国内模型的 API 延迟和稳定性会好很多

当然,也要注意一些潜在问题：

开源协议：小米没有公开 MiMo-V2.5-Pro 的开源协议细节,如果是商用需要确认授权条款
模型稳定性：36 天迭代一个版本,说明模型还在快速演进中,API 接口和行为可能会有变化
社区生态：相比 Llama 和 Qwen,MiMo 的社区生态还比较薄弱,遇到问题可能不太好找解决方案

国产大模型的新阶段

MiMo-V2.5-Pro 登顶全球开源榜首,标志着国产大模型进入了一个新阶段：不再是「追赶」,而是「并跑」甚至「领跑」。

回顾一下这两年的进展：

2024 年初,国产模型还在追 GPT-4 的尾巴
2024 年中,DeepSeek-V2 出来,证明国产模型在某些维度上能跟 GPT-4 打平
2024 年底,Qwen 2.5、DeepSeek-V3 发布,国产模型在开源领域已经是第一梯队
2025 年,Claude Opus 4.6、GPT-5 发布,把闭源模型的天花板又抬高了一截
2026 年 Q1,小米 MiMo-V2.5-Pro 登顶开源榜首,证明国产模型在 Agent 能力上已经能跟顶级闭源模型正面较量

这个进展速度是惊人的。两年前,大家还在讨论「中国大模型什么时候能追上 GPT-3.5」,现在已经在讨论「开源模型什么时候能全面超越闭源模型」了。

但也要看到,闭源模型的优势依然明显：

综合能力：GPT-5、Claude Opus 4.6 在各个维度上都很均衡,没有明显短板
稳定性：闭源模型的 API 服务更成熟,SLA 保障更好
安全性：在内容安全、对齐、防越狱等方面,闭源模型做得更细致
生态：OpenAI、Anthropic 的开发者生态更完善,工具链更丰富

开源模型要全面超越闭源模型,还有很长的路要走。但至少在某些细分领域（比如 Agent、长上下文、多模态）,开源模型已经证明了自己的实力。

小米的 AI 野心

从财报数据看,小米对 AI 的投入是认真的：今年 160 亿元,未来三年超 600 亿元。这个投入规模在国内科技公司里算是第一梯队了（阿里、腾讯、字节的 AI 投入可能更大,但没有公开具体数字）。

小米做 AI 有几个天然优势：

硬件生态：小米有手机、IoT 设备、汽车等硬件产品线,AI 能力可以直接落地到产品上
用户规模：小米的全球用户超过 6 亿,这些用户产生的数据是训练模型的宝贵资源
场景丰富：从智能家居到智能驾驶,小米的业务场景覆盖了 AI 应用的大部分领域
工程能力：小米的软件工程团队一直很强,做 AI 需要的工程化能力（数据处理、模型训练、推理优化、服务部署）都不缺

但小米也有明显的短板：

算力：相比阿里、腾讯、字节,小米的自有算力规模较小,需要依赖云服务商
AI 人才：虽然挖来了罗福莉这样的顶尖人才,但整体 AI 团队的规模和深度还不如 BAT
数据质量：小米的用户数据主要来自硬件设备,在互联网内容数据（文本、图片、视频）上不如内容平台

小米的策略是扬长避短：用开源模型快速占领开发者生态,用硬件产品落地 AI 能力,用价格优势抢市场份额。这个策略能不能成功,还要看后续的执行。

写在最后

MiMo-V2.5-Pro 登顶全球开源榜首,是国产大模型的一个里程碑,但不是终点。大模型的竞争才刚刚开始,技术迭代速度快到让人眼花缭乱。

对开发者来说,这是个好时代：有越来越多性能强、价格低、易获取的模型可以选择。但也是个焦虑的时代：模型更新太快,今天学会的技术明天可能就过时了。

小米这次的成绩值得肯定,但更值得关注的是它能不能持续迭代、持续领先。毕竟,大模型这个赛道上,没有人能躺在功劳簿上睡觉。36 天一个版本的迭代速度,既是优势,也是压力。

参考来源

小米集团：第一季度营收991.4亿元 - 36氪 - 小米 2026 Q1 财报官方数据
小米双模型正式开源！MiMo-V2.5-Pro无中断肝出"macOS" - 知乎 - MiMo-V2.5 系列技术细节和性能对比