MiniMax M3 模型上线：API 与 Token Plan 同步开放

6 月 1 日，MiniMax 内测群确认 M3 模型已上线，API 与全模态订阅 Token Plan 均已可用，距离 M2 系列推出仅过去半年多。

今天上午，MiniMax 在内测群（7.46 群）放出消息：M3 模型已经上线，API 和 Token Plan 双通道同步开放使用。没有发布会，没有预热，老规矩——先给开发者用上再说。

这是 MiniMax 在 2025 年下半年密集迭代 M2 系列之后，半年多时间里抛出的又一代旗舰。从 M1 开源拿下一波关注，到 M2 系列把 Coding Plan 跑通，再到 3 月份把订阅产品升级成全模态的 Token Plan，这家公司在国产大模型阵营里算是少数能保持「半年一代」节奏的玩家。M3 的到来，多少在意料之中，但落地速度还是比外界预期快了一些。

MiniMax M3 模型上线公告界面截图

先把能确认的事说清楚

根据内测群放出的信息，本次上线包含两条路径：

API 通道：开发者可以直接通过 MiniMax 官方 API 调用 M3，模型 ID 已在内测渠道分发，正式文档随后会跟上。
Token Plan 通道：M3 同步进入 Token Plan 订阅体系，原有订阅用户的额度可直接覆盖到 M3 的调用上。

这里要补一个背景。MiniMax 在 3 月 23 日把原本只服务编程场景的 Coding Plan 升级成了 Token Plan——号称「全球首个支持全模态的统一订阅计划」。简单说，原来一个订阅只能买代码模型的额度，升级之后，同一份订阅同时覆盖文本、图像、语音（海螺）、视频、音乐生成，Plus 及以上套餐还在保留 M2.7 编程模型原有用量的基础上，把多模态额度白送进去。

这套逻辑放到 M3 上来看，意义就比较清楚了：M3 不只是一个新模型，而是被直接挂进了一个已经跑了两个多月、有真实付费用户在用的订阅体系里。开发者不需要重新买额度，订阅自动覆盖，迁移成本几乎为零。

M2 到 M3，路径上的几个判断

官方目前没有放出完整的 benchmark 和参数信息，但从 M2 系列的演进轨迹可以推断几件事。

M2.1 是 Token Plan 当前的默认底座，主打通用对话和工具调用；M2.7 则是被定位成编程专用，特别是在 Coding Plan 时代承担了大部分 Agent 类任务。M3 上来同时进入 API 和订阅，意味着它大概率是一个统一替代 M2.1 通用能力位置的版本，而不是单点优化的子型号。

这种「合流」打法，国内厂商里其实不算多见。更常见的做法是分线维护——一个 chat 系列、一个 code 系列、一个 reasoning 系列，各跑各的。MiniMax 这次如果真把 M3 做成统一基座，背后逻辑大概是：在多模态全栈拉齐之后，单独维护多个文本模型的 ROI 已经撑不住了，不如收敛回一条主线，把多模态能力作为差异化。

这条思路对 OpenAI、Anthropic 也成立——GPT-5 发布之后 OpenAI 大幅简化了模型家族，Anthropic 的 Claude 4.5 系列也在做类似的整合。MiniMax 走在同一个方向上，只是节奏更快。

为什么 Token Plan 是关键

纯看模型本身的发布，M3 其实只是行业里一周一次的常规事件。但配合 Token Plan 来看，MiniMax 干的事情就比单纯发模型更值得说。

传统 API 计费的痛点开发者都懂：每个模型一套定价，文本按千 token、图像按张、语音按秒、视频按时长，对账能把财务搞疯。MiniMax 的 Token Plan 把这套结构折叠成了统一的 token 额度池——不管你是调 M3 写代码、调海螺生成视频、还是调 TTS 做语音，都从同一份配额里扣。

订阅套餐示意（基于公开信息）：
Plus 及以上 → M2.7 编程额度 + 多模态额度（白送）
M3 上线后 → M3 通用能力直接进入同一额度池

这种打包方式对中小团队特别友好。一个做 AI 工具的初创团队，过去要在 OpenAI、ElevenLabs、Runway 之间分别买额度、分别接 SDK、分别处理速率限制，现在理论上一个订阅就能跑通整套 demo。当然，前提是 MiniMax 自己的多模态能力够能打——海螺视频和语音模型这一年的口碑确实在涨，所以这套牌打得有底气。

对开发者意味着什么

短期看，几件事可以马上做：

现有 Token Plan 订阅用户：直接把模型 ID 切到 M3 跑一轮回归测试，看你的业务场景有没有提升。订阅额度不变，迁移成本就是改一个字符串。
API 直接调用方：等正式文档放出来之后看定价。M2 系列的 API 价格在国产模型里不算最便宜，但胜在多模态全栈，M3 大概率会延续这个定位。
还在观望的团队：可以把 M3 加进下一轮模型评测的候选池。MiniMax 这次没有公布 benchmark，自己跑一轮才有数。

中长期看，M3 + Token Plan 这套组合如果跑通，会给国内大模型厂商提供一个新的商业化样本——不靠单模型 token 单价竞争，靠订阅打包覆盖全模态需求。这条路 OpenAI 早就在走（ChatGPT 订阅 + API 双轨），但在国内的 API 市场，这种打法相对还少见。

调用方式

M3 上线当天，OpenAI Hub 已经把模型接入聚合 API 列表，兼容 OpenAI 格式，国内可直连。对于已经在用 OpenAI Hub 一个 Key 调多家模型的开发者来说，把 M3 加进来不需要改任何鉴权逻辑，只换 model 字段即可——这种场景下，多模型并行 A/B 测试的成本接近零。

还在等的几件事

M3 这波上线信息密度不算高，几个关键问题官方还没给：

完整 benchmark：M3 在 MMLU、GPQA、SWE-bench、AIME 等主流榜单上的成绩还没放出，没有横向对比就很难判断它和 GPT-5、Claude 4.5、DeepSeek V4、Qwen3 Max 之间的实际差距。
上下文窗口：M2.1 是 128K 起步，M3 是否上探到 256K 甚至更长，会直接影响它在 Agent 长链路任务里的可用性。
多模态对齐：既然 Token Plan 主打全模态打包，M3 是不是原生多模态、还是依然走「文本主模型 + 海螺视频 + TTS」的拼接路线，这一点比较关键。

按 MiniMax 一贯的节奏，正式技术报告和定价细节大概会在一两周内补齐。在那之前，建议直接上手测——这家公司的模型，paper 上的数字向来不如实际跑出来的体感更说明问题。

参考来源

LINUX DO 社区原帖：MINIMAX M3已经可用 — 内测群消息首发，确认 M3 已上线、Token Plan 与 API 双通道开放

MiniMax M3 上线：API 与 Token Plan 同步开放