小米MiMo-V2.5全量开源,MIT协议直接商用

模型上新

小米正式全球开源 MiMo-V2.5 与 MiMo-V2.5-Pro 两款大模型,采用 MIT 协议开放全部权重与推理代码,支持商用部署与二次训练,同步启动百万亿 Token 激励的 MiMo Orbit 生态计划。

小米这次没藏着掖着。

4 月底,Xiaomi MiMo-V2.5 系列模型正式面向全球开源,MiMo-V2.5 和 MiMo-V2.5-Pro 两款模型的权重、推理代码全量放出,协议选的是 MIT——开源世界里最宽松的那种。翻译成人话:你拿去商用、魔改、蒸馏、套壳,都不用跟小米打招呼。

这在国内大模型厂商里,算得上一个相当激进的动作。

两款模型,定位不同

MiMo-V2.5 系列这次一共发了四款模型,但开源的是其中两款核心型号:

  • MiMo-V2.5:定位通用基座,覆盖日常对话、内容生成、代码辅助等主流场景,适合中小团队拿来做微调和垂直应用。
  • MiMo-V2.5-Pro:小米目前公开的最强模型。官方的说法是,在通用智能体能力、复杂软件工程和长程任务规划等维度上,能跟 Claude Opus 4.6、GPT-5.4 这个级别的模型正面过招。

MiMo-V2.5 与 MiMo-V2.5-Pro 模型能力对比雷达图

"正面较量"这个措辞当然带着营销成分,但如果你关注过 MiMo 系列的迭代轨迹,会发现小米在大模型上的进步速度确实不慢。从 2024 年底 MiMo-V1 低调亮相,到 V2-Flash 以 MIT 协议试水开源,再到今天 V2.5 全量放出——不到两年,三个大版本,节奏比很多纯 AI 公司还快。

这背后是真金白银的投入。根据公开信息,小米过去三年在 AI 领域的累计投入已经超过 600 亿元人民币。这个数字放在国内,仅次于几家头部互联网公司。

MIT 协议意味着什么

聊开源模型,协议是绕不开的话题。

过去两年,国内大模型的"开源"经历了一个从混乱到逐渐清晰的过程。早期不少厂商打着开源旗号,实际用的是各种自定义协议——有的限制商用规模,有的禁止用于竞品训练,有的要求署名加注。开发者拿到权重,还得先花半小时读法律条款,判断自己的场景到底合不合规。

小米这次选 MIT,态度很明确:不设门槛。

MIT 协议的核心就一句话——你可以用这份代码做任何事,只要保留版权声明。没有商用限制,没有使用场景限制,没有模型输出的归属争议。对于想把模型集成进自己产品的开发者和企业来说,这是法律风险最低的选项。

做个对比:

协议 商用 二次训练 蒸馏 修改再分发 典型代表
MIT MiMo-V2.5
Apache 2.0 ✅(需注明修改) LLaMA 3
自定义协议 有条件 有条件 通常禁止 有条件 部分国产模型

当然,MIT 协议也意味着小米放弃了通过协议约束来构建护城河的可能性。竞争对手完全可以拿 MiMo-V2.5 的权重去做自己的产品,甚至训练出一个更好的模型来反过来竞争。小米显然想清楚了这一点——它要的不是模型本身的商业化,而是生态。

Pro 版本到底有多强

说回模型能力本身。

MiMo-V2.5-Pro 被小米定义为"至今最强大模型",官方给出的对标对象是 Claude Opus 4.6 和 GPT-5.4。这两个都是当前闭源模型的第一梯队,尤其在 Agent 场景和复杂推理任务上表现突出。

小米特别强调了几个方向的能力:

通用智能体能力(Agent)。这是当下大模型竞争最激烈的战场。一个好的 Agent 模型不只是能聊天,还要能理解多步骤指令、调用外部工具、在真实环境中完成任务。比如你让它"帮我查一下最近三个月的 GitHub 提交记录,找出引入 bug 的那次 commit,然后生成修复方案"——这种需要规划、执行、反馈、调整的链式任务,才是 Agent 能力的真正考验。

复杂软件工程。写代码谁都会,但理解一个几十万行的代码库、定位跨模块的 bug、生成符合项目规范的 PR——这需要模型具备长上下文理解和工程化思维。MiMo-V2.5-Pro 在这个方向上的表现,是小米这次宣传的重点之一。

长程任务规划。不是回答一个问题,而是完成一个项目。模型需要把一个大目标拆解成可执行的子任务,按顺序推进,遇到障碍时自主调整策略。这本质上考验的是模型的"工作记忆"和规划能力。

具体的 benchmark 数据,小米在开源页面上应该会陆续放出。但说实话,跑分和实际使用之间的差距,做过模型部署的人都懂。建议感兴趣的开发者直接拉下来跑几个自己业务场景的 case,比看任何排行榜都靠谱。

国产芯片适配:一个值得注意的信号

这次开源还有一个容易被忽略的细节:小米明确表示 MiMo-V2.5 系列将适配国产芯片平台。

这不是一句空话。在当前的国际环境下,高端 AI 芯片的供应始终是悬在国内 AI 行业头上的一把剑。NVIDIA 的 H100/H200 受出口管制影响,国内获取渠道越来越窄。如果开源模型只能跑在 NVIDIA GPU 上,那"开源"的实际价值就要打个折扣。

小米选择主动适配国产芯片,一方面是响应政策方向,另一方面也是在给自己的生态计划铺路——如果你想让更多国内开发者和企业用你的模型,就不能只考虑算力条件最好的那批用户。

具体适配哪些国产芯片平台,目前官方还没有给出完整清单。但从行业惯例来看,华为昇腾、寒武纪等主流国产 AI 芯片大概率在列。

MiMo Orbit:不只是开源,还要建生态

模型开源只是第一步。小米同步推出了 MiMo Orbit 计划,这才是这次发布的战略重心。

Orbit 计划包含两个子项目:

创造者百万亿 Token 激励计划

面向所有 AI builder,简单说就是:你用 MiMo 的模型做应用,小米给你免费的推理额度。百万亿 Token 这个量级,足够支撑相当规模的应用开发和测试。

对于独立开发者和小团队来说,推理成本一直是个现实问题。一个日活几万的 AI 应用,每月的 API 调用费用轻松上万。小米用免费 Token 来吸引开发者进入 MiMo 生态,逻辑上跟云厂商早年送代金券拉新是一样的——先把人圈进来,生态起来了再说商业化。

Agent 生态共建计划

这个面向的是 Agent 框架团队。当前 Agent 开发领域有大量的开源框架——LangChain、CrewAI、AutoGen、MetaGPT 等等——但这些框架底层调用的模型,长期以来以 GPT 和 Claude 为主。小米想做的,是让 MiMo-V2.5-Pro 成为这些框架的"一等公民"。

如果 MiMo-V2.5-Pro 的 Agent 能力确实能接近 Claude Opus 4.6 的水平,同时又是完全开源、可以本地部署的,那对于很多对数据安全有要求的企业场景来说,吸引力不小。毕竟不是所有公司都愿意把业务数据发给海外的闭源 API。

开源大模型的竞争格局

把视角拉远一点,MiMo-V2.5 的开源放在整个行业里看,是什么位置?

2025 到 2026 年,开源大模型的竞争已经进入深水区。Meta 的 LLaMA 系列持续迭代,阿里的 Qwen 在国内开源生态中占据了相当大的份额,DeepSeek 凭借极致的性价比杀出了一条血路,Mistral 在欧洲市场站稳了脚跟。

小米作为一家以硬件和消费电子起家的公司,做大模型的叙事逻辑跟上面这些玩家都不一样。它的核心优势不在算法研究的深度,而在于:

  1. 终端设备的规模。小米有手机、平板、电视、IoT 设备——这些都是大模型落地的天然载体。一个能在端侧高效运行的模型,配合小米的硬件生态,想象空间很大。
  2. 工程化能力。小米做手机这么多年,供应链管理和工程落地能力是经过验证的。把这套能力迁移到 AI 模型的训练和部署上,效率不会差。
  3. 用户基数。小米全球有数亿活跃设备用户,这意味着模型一旦集成进 MIUI/HyperOS,天然就有海量的使用场景和反馈数据。

当然,劣势也很明显。跟专注做模型的团队比,小米的 AI 研究积累相对薄弱;跟互联网巨头比,数据资源和算力储备也有差距。MiMo-V2.5-Pro 能不能真的在 Agent 场景上跟 Claude Opus 4.6 掰手腕,还需要社区的实际测试来验证。

对开发者来说,怎么用

如果你想上手试试 MiMo-V2.5,几个建议:

本地部署。权重和推理代码都已经开放,可以直接从小米的官方渠道或 Hugging Face 下载。MIT 协议意味着你不需要申请任何 license,clone 下来就能跑。

微调场景。如果你有垂直领域的数据,MiMo-V2.5 的 MIT 协议允许你自由进行 SFT(监督微调)甚至全量训练。对于医疗、法律、金融等需要领域适配的场景,这是一个成本较低的起点。

Agent 开发。如果你在做 Agent 相关的项目,MiMo-V2.5-Pro 值得重点关注。一个开源的、可本地部署的强 Agent 模型,在数据合规和成本控制上都有明显优势。

申请 Token 激励。如果你是独立开发者或小团队,MiMo Orbit 的百万亿 Token 激励计划值得申请。免费的推理额度,能省下来的钱拿去买咖啡不好吗。申请入口在 100t.xiaomimimo.com。

一点判断

小米做大模型,从一开始就不被很多人看好。一家硬件公司,凭什么跟那些 all-in AI 的团队竞争?

但 MiMo-V2.5 的开源,至少说明了两件事:

第一,小米是认真的。600 亿的投入、MIT 协议的全量开源、配套的生态激励计划——这不是一个试水的姿态,而是一个长期押注的信号。

第二,大模型的竞争正在从"谁的模型最强"转向"谁的生态最活"。OpenAI 有 API 生态,Meta 有开源社区,小米想用 MIT 协议 + 免费 Token + 硬件终端,搭建自己的生态闭环。能不能成,现在下结论还太早,但方向是对的。

对开发者来说,多一个高质量的开源选择,永远不是坏事。拉下来跑跑看,让代码说话。


参考来源: