小米官宣 MiMo-V2.5 即将开源,正面对决 DeepSeek
小米昨晚突然官宣 MiMo-V2.5 系列模型开启公测,更关键的是——MiMo-V2.5-Pro 和 MiMo-V2.5 即将全球开源。这是小米 MiMo 大模型负责人罗福莉(原 DeepSeek 核心成员)加入小米后的又一次大动作,距离上次 V2 系列发布仅过去 36 天。
时间点耐人寻味。DeepSeek V4 被传本周发布,小米抢在前面放出两款开源模型,参数规模和定位恰好对标 DeepSeek 系列。开发者社区已经开始讨论:这是要在开源赛道上正面硬刚?
两款模型,各有侧重
这次发布的核心是两款模型:
MiMo-V2.5-Pro 是小米目前最强模型,专攻长链 Agent 任务。官方数据显示,它能稳定完成近千轮工具调用,在 MiMo Coding Bench 上拿到 73.7 分,与 Claude Opus 4.6(77.1 分)的差距进一步缩小。
实测案例很能说明问题。让 V2.5-Pro 用 Rust 实现完整的 SysY 编译器(北大《编译原理》课程项目,本科生通常要做几周),它用 4.3 小时、672 次工具调用就搞定了,在隐藏测试集上拿满分 233 分。整个过程包括词法分析、语法分析、AST、Koopa IR 代码生成、RISC-V 汇编后端和性能优化,冷启动通过率 59%——意味着架构一次就对了。
另一个案例是开发视频编辑器 Web 应用。V2.5-Pro 写了 8192 行代码,历经 1868 次工具调用,11.5 小时自主完成,交付的应用具备多轨道时间线、片段裁剪、交叉淡化、音频混合等功能。
还有个更硬核的:基于台积电 180nm CMOS 工艺设计 FVF-LDO(翻转电压跟随器低压差线性稳压器)。这种活儿经验丰富的模拟电路设计师要做几天,V2.5-Pro 接入 ngspice 仿真循环后,一小时闭环迭代就生成了满足所有指标的设计,四个关键指标比初始版本提升一个数量级。
MiMo-V2.5 则是通用型全模态 Agent 模型,能同时处理图像、音频、视频,推理速度比 Pro 版快,适合对时延敏感的任务。在 Claw-Eval(面向 AI 智能体的端到端评测基准)上,V2.5 表现超过上一代旗舰 V2-Pro,API 成本还降了约 50%。
多模态能力上,V2.5 在 VideoMME、CharXiv、MMMU-Pro 等评测中逼近甚至超越 Claude Opus 4.6、Gemini 3 Pro、GPT-5.4。编程方面,日常任务超过 Gemini 3.1 Pro,但跟 Claude Opus 4.6 还有明显差距。
Token 效率才是杀手锏
性能是一方面,更实在的是 Token 效率。
小米给出的对比数据:
- MiMo-V2.5-Pro 在 Claw-Eval 拿到相同分数的情况下,比 Kimi K2.6 节省 42% Token
- MiMo-V2.5 比 Meta 的 Muse Spark 节省 50% Token
这意味着什么?同样的任务,用 MiMo 跑一遍,成本直接砍一半。对于需要大量调用 API 的 Agent 应用来说,这个差距会被放大几十倍甚至上百倍。
小米同步优化了 Token Plan 订阅计划:
- 取消之前 1 Token = 4 Credits 的计费方式
- 不再区分 256k 和 1M 上下文窗口的倍率
- 新增夜间优惠时段(00:00-08:00),所有模型 Credits 消耗再打 8 折
- 上线连续包月和包年订阅,包年最多减 948.96 元
V2.5 的计费是 1x(1 Token = 1 Credit),V2.5-Pro 是 2x(1 Token = 2 Credits)。之前 Token Plan 刚推出时,不少用户吐槽价格贵、便宜套餐不够用,这次调整算是回应了市场反馈。
开源策略的算盘
小米为什么要开源?
罗福莉在上一代模型发布时就说过,"未来模型足够稳定后会开源"。现在兑现承诺,时机选得很微妙——DeepSeek V4 发布在即,小米抢先一步放出两款开源模型,参数规模和定位恰好对标 DeepSeek 系列。
今年 3 月,小米 MiMo-V2-Pro 曾以匿名模型 "Hunter Alpha" 的身份出现在 OpenRouter 平台上,一度被开发者误认为是 DeepSeek V4。现在 V2.5 系列正式发布,又赶在 DeepSeek V4 传闻发布的同一周,这节奏感拉满。
开源对小米有什么好处?最直接的是抢占开发者生态。Agent 时代,谁的模型被更多开发者用来搭应用,谁就掌握了基础设施的话语权。小米作为硬件厂商,自研大模型、系统级权限、全生态服务深度绑定,开源模型能加速这套体系在人车家全场景的落地。
另一个考量是成本。开源模型可以本地部署,对于需要大规模调用的场景(比如小米自己的 IoT 设备、汽车),不用每次都走云端 API,能省下巨额推理成本。
市场反应:有人看好,有人观望
开发者社区对 MiMo-V2.5 的反应比较分裂。
看好的人主要盯着 Token 效率和开源承诺。有人在爱马仕(Cursor 的昵称)里一直用 MiMo,觉得"反正免费,效果也没和其他国模差多少,文字功底更是无敌"。开源之后,本地部署、二次训练的空间就打开了,对于有定制需求的团队来说是实实在在的利好。
观望的人则质疑市场接受度。有人直言"无人在意,我就没听说谁用小米模型的"。这话虽然刻薄,但确实反映了一个现实:小米在大模型领域起步晚,品牌认知度远不如 DeepSeek、Kimi、通义千问这些先行者。罗福莉之前在 DeepSeek 的光环能带来多少加成,还得看后续表现。
还有人提到罗福莉此前说过"Token 太便宜了不挣钱",现在小米又是降价又是开源,这套组合拳到底是战略性亏损抢市场,还是真的找到了成本优化的路子?答案可能要等开源后,看社区实测数据才能知道。
技术细节:Agent 能力是核心
MiMo-V2.5 系列的技术重点在 Agent 能力上。
V2.5-Pro 能稳定完成近千轮工具调用,这个数字在业内算是顶级水平。长链推理最大的难点是保持逻辑一致性——前面几百轮的上下文信息要能被后面的推理准确引用,同时还要处理工具调用失败、中间结果异常等各种边界情况。小米内部测试显示,V2.5-Pro 在指令遵循能力上有明显提升,既能捕捉隐性要求,又能在超长周期内不跑偏。
全模态感知是 V2.5 的另一个亮点。它能同时处理图像、音频、视频,并根据感知到的信息采取行动。这种能力在实际应用中很有用,比如让 Agent 看一段视频教程,然后自己操作软件完成任务;或者听一段语音指令,结合屏幕截图理解用户意图。
编程能力方面,V2.5 在日常任务上超过 Gemini 3.1 Pro,但跟 Claude Opus 4.6 还有差距。这个差距主要体现在复杂代码重构、大型项目架构设计等高阶任务上。不过对于大多数开发者来说,日常写代码、调 bug、生成测试用例,V2.5 已经够用了。
开源之后,看什么?
小米说 V2.5-Pro 和 V2.5 "即将全球开源",但没给具体时间。按照惯例,从宣布到真正放出权重、代码、训练细节,可能还要等几周甚至一两个月。
开源之后,开发者最关心的几个问题:
权重大小和硬件要求。如果模型太大,普通开发者根本跑不动,开源的意义就打折扣了。DeepSeek V3 开源后,不少人吐槽显存要求太高,只能用量化版本。小米会不会同步放出量化版本?
训练数据和方法。罗福莉在 DeepSeek 时期就以技术透明著称,MiMo 会不会延续这个风格,公开训练细节?如果只放权重不放数据和方法,社区能玩出的花样就有限。
商业授权。开源不等于免费商用。具体采用什么协议(MIT、Apache 2.0、还是自定义协议),能不能用于商业产品,这些细节会直接影响企业用户的决策。
生态工具。模型开源只是第一步,配套的推理框架、部署工具、Fine-tuning 脚本能不能跟上?DeepSeek 开源后,社区很快就有了各种优化版本和应用案例,小米能不能复制这个路径?
写在最后
小米这次动作够快,但能不能在开源大模型赛道站稳脚跟,还得看后续执行。
DeepSeek 的成功不只是模型本身,更在于技术透明度和社区运营。罗福莉带着 DeepSeek 的基因加入小米,能不能把这套打法复制过来,是个关键变量。
另一个变量是小米的硬件生态。如果 MiMo 能跟小米手机、汽车、IoT 设备深度整合,形成端云协同的 Agent 体系,那开源模型就不只是技术输出,而是整个生态的基础设施。这条路 OpenAI、Google 都在走,小米作为硬件厂商,反而有独特优势。
至于跟 DeepSeek 的正面对决,现在下结论还早。V4 还没发布,V2.5 也没开源,两边都在憋大招。开发者最希望看到的,是良性竞争推动整个行业往前走——模型越来越强,成本越来越低,开源越来越彻底。
从这个角度看,小米入局是好事。
参考来源
- 小米MiMo要开源了!- Linux.do 社区讨论 - 开发者对 MiMo 开源的第一手反应和讨论
- DeepSeek V4发布前,罗福莉亮剑,小米最强大模型MiMo-V2.5深夜突袭 - 36氪 - 详细技术解读和实测案例
- 小米发布MiMo-V2.5 系列四款模型 - YouTube AI 早报 - 视频快讯
- 小米大模型MiMo-V2.5-Pro和MiMo-V2.5将全球开源 - PChome - 官方发布信息汇总