今天上午,MiniMax 在内测群(7.46 群)放出消息:M3 模型已经上线,API 和 Token Plan 双通道同步开放使用。没有发布会,没有预热,老规矩——先给开发者用上再说。
这是 MiniMax 在 2025 年下半年密集迭代 M2 系列之后,半年多时间里抛出的又一代旗舰。从 M1 开源拿下一波关注,到 M2 系列把 Coding Plan 跑通,再到 3 月份把订阅产品升级成全模态的 Token Plan,这家公司在国产大模型阵营里算是少数能保持「半年一代」节奏的玩家。M3 的到来,多少在意料之中,但落地速度还是比外界预期快了一些。

先把能确认的事说清楚
根据内测群放出的信息,本次上线包含两条路径:
- API 通道:开发者可以直接通过 MiniMax 官方 API 调用 M3,模型 ID 已在内测渠道分发,正式文档随后会跟上。
- Token Plan 通道:M3 同步进入 Token Plan 订阅体系,原有订阅用户的额度可直接覆盖到 M3 的调用上。
这里要补一个背景。MiniMax 在 3 月 23 日把原本只服务编程场景的 Coding Plan 升级成了 Token Plan——号称「全球首个支持全模态的统一订阅计划」。简单说,原来一个订阅只能买代码模型的额度,升级之后,同一份订阅同时覆盖文本、图像、语音(海螺)、视频、音乐生成,Plus 及以上套餐还在保留 M2.7 编程模型原有用量的基础上,把多模态额度白送进去。
这套逻辑放到 M3 上来看,意义就比较清楚了:M3 不只是一个新模型,而是被直接挂进了一个已经跑了两个多月、有真实付费用户在用的订阅体系里。开发者不需要重新买额度,订阅自动覆盖,迁移成本几乎为零。
M2 到 M3,路径上的几个判断
官方目前没有放出完整的 benchmark 和参数信息,但从 M2 系列的演进轨迹可以推断几件事。
M2.1 是 Token Plan 当前的默认底座,主打通用对话和工具调用;M2.7 则是被定位成编程专用,特别是在 Coding Plan 时代承担了大部分 Agent 类任务。M3 上来同时进入 API 和订阅,意味着它大概率是一个统一替代 M2.1 通用能力位置的版本,而不是单点优化的子型号。
这种「合流」打法,国内厂商里其实不算多见。更常见的做法是分线维护——一个 chat 系列、一个 code 系列、一个 reasoning 系列,各跑各的。MiniMax 这次如果真把 M3 做成统一基座,背后逻辑大概是:在多模态全栈拉齐之后,单独维护多个文本模型的 ROI 已经撑不住了,不如收敛回一条主线,把多模态能力作为差异化。
这条思路对 OpenAI、Anthropic 也成立——GPT-5 发布之后 OpenAI 大幅简化了模型家族,Anthropic 的 Claude 4.5 系列也在做类似的整合。MiniMax 走在同一个方向上,只是节奏更快。
为什么 Token Plan 是关键
纯看模型本身的发布,M3 其实只是行业里一周一次的常规事件。但配合 Token Plan 来看,MiniMax 干的事情就比单纯发模型更值得说。
传统 API 计费的痛点开发者都懂:每个模型一套定价,文本按千 token、图像按张、语音按秒、视频按时长,对账能把财务搞疯。MiniMax 的 Token Plan 把这套结构折叠成了统一的 token 额度池——不管你是调 M3 写代码、调海螺生成视频、还是调 TTS 做语音,都从同一份配额里扣。
订阅套餐示意(基于公开信息):
Plus 及以上 → M2.7 编程额度 + 多模态额度(白送)
M3 上线后 → M3 通用能力直接进入同一额度池
这种打包方式对中小团队特别友好。一个做 AI 工具的初创团队,过去要在 OpenAI、ElevenLabs、Runway 之间分别买额度、分别接 SDK、分别处理速率限制,现在理论上一个订阅就能跑通整套 demo。当然,前提是 MiniMax 自己的多模态能力够能打——海螺视频和语音模型这一年的口碑确实在涨,所以这套牌打得有底气。
对开发者意味着什么
短期看,几件事可以马上做:
- 现有 Token Plan 订阅用户:直接把模型 ID 切到 M3 跑一轮回归测试,看你的业务场景有没有提升。订阅额度不变,迁移成本就是改一个字符串。
- API 直接调用方:等正式文档放出来之后看定价。M2 系列的 API 价格在国产模型里不算最便宜,但胜在多模态全栈,M3 大概率会延续这个定位。
- 还在观望的团队:可以把 M3 加进下一轮模型评测的候选池。MiniMax 这次没有公布 benchmark,自己跑一轮才有数。
中长期看,M3 + Token Plan 这套组合如果跑通,会给国内大模型厂商提供一个新的商业化样本——不靠单模型 token 单价竞争,靠订阅打包覆盖全模态需求。这条路 OpenAI 早就在走(ChatGPT 订阅 + API 双轨),但在国内的 API 市场,这种打法相对还少见。
调用方式
M3 上线当天,OpenAI Hub 已经把模型接入聚合 API 列表,兼容 OpenAI 格式,国内可直连。对于已经在用 OpenAI Hub 一个 Key 调多家模型的开发者来说,把 M3 加进来不需要改任何鉴权逻辑,只换 model 字段即可——这种场景下,多模型并行 A/B 测试的成本接近零。
还在等的几件事
M3 这波上线信息密度不算高,几个关键问题官方还没给:
- 完整 benchmark:M3 在 MMLU、GPQA、SWE-bench、AIME 等主流榜单上的成绩还没放出,没有横向对比就很难判断它和 GPT-5、Claude 4.5、DeepSeek V4、Qwen3 Max 之间的实际差距。
- 上下文窗口:M2.1 是 128K 起步,M3 是否上探到 256K 甚至更长,会直接影响它在 Agent 长链路任务里的可用性。
- 多模态对齐:既然 Token Plan 主打全模态打包,M3 是不是原生多模态、还是依然走「文本主模型 + 海螺视频 + TTS」的拼接路线,这一点比较关键。
按 MiniMax 一贯的节奏,正式技术报告和定价细节大概会在一两周内补齐。在那之前,建议直接上手测——这家公司的模型,paper 上的数字向来不如实际跑出来的体感更说明问题。
参考来源
- LINUX DO 社区原帖:MINIMAX M3已经可用 — 内测群消息首发,确认 M3 已上线、Token Plan 与 API 双通道开放