MiniMax 计划数周内发布小参数 M3 模型，随后推出大参数变体，6 月发布对标 Seedance 2.0 的 Hailuo 3。管理层明确将借 3 系列模型提价，目前文本 API 毛利率已达 40%，多模态 API 更高达 60%-70%。

MiniMax 路线图曝光：小参数快速迭代，API 涨价在即

MiniMax 的下一步棋已经摆上了桌面。根据 Linux.do 社区流出的内部消息，这家国内多模态大模型公司正在筹备 M3 系列和 Hailuo 3 的发布，产品策略和定价逻辑都有了明确方向。

小参数先行，大参数跟进

M3 系列的发布节奏是典型的「小步快跑」：未来数周内先推出一款参数较小的版本，随后数月内再发布参数更大的变体。两款模型的核心目标是提升编码能力和智能体任务执行能力——这是当前大模型竞争的两个关键战场。

这个策略并不意外。从 M2.5 在 SWE-Bench Verified 上拿到 80.2% 的成绩来看，MiniMax 在 Agent 能力上已经建立了一定优势。M3 系列显然是要巩固这个位置，同时通过小参数版本快速覆盖对成本敏感的开发者群体。

参数规模的分层发布也符合行业趋势。OpenAI 的 GPT-4o 和 GPT-4o mini、Anthropic 的 Claude Opus 和 Haiku、Google 的 Gemini Pro 和 Flash，都在用不同参数量的模型覆盖不同场景。MiniMax 这次跟进，说明他们对自己的模型架构有信心——MoE（混合专家）架构在保持性能的同时压缩推理成本，正是做分层产品的基础。

Hailuo 3：对标 Seedance 2.0 的野心

视频生成这边，Hailuo 3 计划在 2026 年 6 月推出，距离 2025 年 10 月发布的 Hailuo 2.3 大约相隔八个月。这个节奏比文本模型慢，但考虑到视频生成的训练成本和技术难度，八个月一代已经算快的了。

关键信息是管理层明确表示 Hailuo 3 基于「原生理解生成架构」构建,设计理念对标字节跳动的 Seedance 2.0。这个表态很有意思。Seedance 2.0 是字节在视频生成领域的旗舰产品,主打物理规律准确性和运动连贯性。MiniMax 选择对标它,说明 Hailuo 3 不会只是画面质量的提升,而是要在「视频理解真实世界规律」这个方向上发力。

从技术路线看,这符合当前 AI 视频生成的前沿方向。单纯靠扩散模型堆算力已经不够了,模型需要理解物理常识、空间关系、运动逻辑。匹兹堡大学的 PhyT2V 研究、MIT 的 World Models 工作,都在探索如何让模型具备「世界模型」能力。MiniMax 提到的「原生理解生成架构」,很可能是在这个方向上的尝试。

Hailuo 2.3 已经累计生成了 5.9 亿条视频,这个数据量为 Hailuo 3 的训练提供了宝贵的反馈信号。如果 Hailuo 3 真能在物理准确性上接近 Seedance 2.0,那它在国内视频生成市场的竞争力会显著提升。

API 涨价的底气：毛利率远超同行

最值得关注的是定价策略。管理层明确表示,推出 3 系列模型将成为提高 API 各层级定价的主要杠杆。这不是试探,是明牌。

为什么敢涨价?因为利润率已经远超同行。高盛的估算数据很说明问题:

MiniMax 文本 API 毛利率约 40%
行业同行平均水平 20%-25%
MiniMax 多模态 API 毛利率 60%-70%

文本 API 毛利率是同行的两倍,多模态更是高到离谱。这个数字背后是 MoE 架构带来的推理效率优势。万亿参数规模下,MoE 只激活部分专家网络,推理成本远低于稠密模型。这让 MiniMax 有空间在保持价格竞争力的同时获得更高利润,或者在涨价后依然比竞品便宜。

从商业逻辑看,这个策略很合理。M3 和 Hailuo 3 如果能在能力上拉开与上一代的差距,那涨价就有了正当理由。开发者愿意为更强的能力付费,前提是性价比依然在线。MiniMax 的毛利率空间意味着他们可以在涨价的同时保持相对竞争力的绝对价格。

但这也意味着对开发者来说,成本优化会变得更重要。如果你的应用大量依赖 MiniMax API,需要提前评估涨价对成本结构的影响,考虑是否需要调整调用策略或引入其他模型作为备选。

全模态融合的长期布局

MiniMax 的产品矩阵已经覆盖文本、语音、视频、音乐四个模态。M3 和 Hailuo 3 的发布,是在各自模态内的纵向深化。但更值得关注的是横向融合。

闫俊杰此前表示,M3 及 Hailuo 3 系列模型已针对多模态融合场景进行架构设计,计划于 2026 年下半年推出多模态融合能力。这意味着文本、语音、视频、音乐之间的无缝转换和跨模态理解,不再是各自独立的 API,而是统一的模型能力。

这个方向的想象空间很大。比如用自然语言描述一个场景,模型直接生成带配乐的视频;或者上传一段视频,模型提取其中的对话、背景音、画面元素,分别进行编辑和重组。这些能力如果真能落地,会显著降低多模态内容创作的门槛。

但技术难度也不小。跨模态对齐、统一表征学习、多模态推理,都是学术界还在攻克的问题。MiniMax 能做到什么程度,要等 2026 年下半年的实际产品才能验证。

行业位置：从模型公司到平台生态

MiniMax 的定位正在从单纯的模型开发公司向平台生态演进。海螺 AI 是 C 端流量入口,累计生成 5.9 亿条视频证明了产品的市场接受度。MiniMax 开放平台服务近万家企业,日处理 Token 数百亿,这是 B 端变现的基础。

M3 和 Hailuo 3 的发布,会进一步强化这个飞轮。更强的模型能力吸引更多开发者,更多开发者带来更多数据和反馈,反过来又能优化模型。API 涨价虽然会流失一部分价格敏感用户,但对于看重能力的企业客户来说,只要性价比依然合理,他们会继续买单。

从竞争格局看,MiniMax 面对的对手既有 OpenAI、Anthropic 这样的国际巨头,也有字节、阿里、百度这样的国内大厂,还有智谱、月之暗面、阶跃星辰这样的创业公司。M3 系列能否在 Agent 能力上保持领先,Hailuo 3 能否在视频生成上追上 Seedance 2.0,这两个问题的答案将直接决定 MiniMax 在这场混战中的位置。

对开发者的影响

如果你正在用或考虑用 MiniMax API,有几个点需要注意:

成本规划:API 涨价是明确信号,提前评估对项目成本的影响。如果你的应用对价格敏感,考虑引入多模型策略,用小参数模型处理简单任务,大参数模型处理复杂任务。
能力升级:M3 系列在编码和 Agent 能力上的提升,可能会解锁一些之前做不了或做不好的场景。如果你的应用涉及代码生成、自动化工作流、复杂推理,值得关注 M3 的实际表现。
多模态融合:如果你的产品需要跨模态能力(比如视频配音、图文生成、音乐可视化),2026 年下半年的多模态融合版本可能会简化你的技术栈。但在此之前,还是得用多个独立 API 拼接。
备选方案:不要把鸡蛋放在一个篮子里。MiniMax 的能力和价格都在变化,保持对其他模型(DeepSeek、GLM、Qwen、Kimi 等)的关注,确保你有 Plan B。

未经验证的消息,但逻辑自洽

需要说明的是,这些信息来自社区爆料,MiniMax 官方尚未公开确认。但从产品节奏、技术路线、商业逻辑来看,这些计划都是合理的。小参数快速迭代、视频生成对标头部产品、借新模型涨价,这些都是成熟公司会做的事。

真正的验证要等产品发布。M3 小参数版本如果真在数周内推出,那这个爆料的可信度就很高了。到时候看实际性能、定价、API 文档,就能判断 MiniMax 这步棋下得怎么样。

对于开发者来说,提前了解这些信息总是有价值的。至少在做技术选型和成本规划时,你知道 MiniMax 的方向是什么,能做出更明智的决策。

参考来源

MiniMax 小道消息 - Linux.do - 社区爆料 M3 和 Hailuo 3 发布计划及定价策略
围绕"全模态"与"高质量",告别单纯"卷模型",向AI平台生态演进 - 知乎 - MiniMax 多模态融合架构设计
MiniMax - AI平台 | AI工具集 - MiniMax 产品矩阵和技术能力概览