MiniMax M2.7:性能追平Claude,协议却从MIT倒退到禁商用

模型上新

MiniMax 最新开源模型 M2.7 在 SWE-Pro 基准上逼近 Claude Opus,但其许可证从前代的 MIT 骤变为禁止商用的 Modified-MIT,开发者社区炸锅,质疑这是一场精心包装的「伪开源」。

模型很强,协议很迷

MiniMax(稀宇科技)上周放出了新一代开源模型 M2.7。单看性能数据,这是一次值得认真对待的发布——SWE-Pro 编程基准 56.22%,几乎追平 Anthropic Claude Opus,在国产开源模型里属于第一梯队。

但开发者社区的注意力完全没放在跑分上。所有人都在盯着 Hugging Face 仓库里那份许可证文件。

因为 MiniMax 把协议从 MIT 换成了一个叫 "Modified-MIT" 的东西。核心变化只有一条,但足够致命:商业用途必须获得 MiniMax 事先书面授权,否则禁止使用。

上一代 M2.5 系列用的是标准 MIT 协议——开源世界里最宽松的许可证之一,你可以拿去卖钱、改代码、闭源分发,唯一要求是保留版权声明。而现在,M2.7 的协议直接把商业使用的大门关上了,还加了一把需要「书面审批」才能打开的锁。

社区的反应很直接:这还叫开源?

MiniMax M2.7 在 Hugging Face 上的许可证页面截图,显示 Modified-MIT 条款中关于商业用途限制的关键段落

"Modified-MIT":一份精心设计的限制条款

我们仔细看了这份许可证。它保留了 MIT 协议的基本框架——允许复制、修改、分发——但在商业使用上加了三层限制:

  1. 商业用途需书面授权:任何「主要意图为商业利益或金钱补偿」的使用场景,都必须提前拿到 MiniMax 的书面许可。
  2. 商业定义极其宽泛:向第三方收费的产品或服务、商业 API 接口、甚至微调后用于盈利目的的部署,全部算商业用途。
  3. 强制品牌标注:获得商业授权后,你还必须在网站、界面或文档中显著标注 "Built with MiniMax M2.7"。

第二条是最让开发者不舒服的。按照这个定义,如果你是一家初创公司,拿 M2.7 微调了一个垂直领域模型,部署在自己的产品里——对不起,这算商业用途,你需要先给 MiniMax 写邮件申请。

这跟 Meta 的 Llama 系列许可证有点像,但 Llama 至少给了一个明确的门槛(月活 7 亿以下免费商用)。MiniMax 的条款里没有任何量化标准,商用与否完全取决于 MiniMax 的审批,这让开发者处于一种不确定的状态。

更让人在意的是命名。叫它 "Modified-MIT" 本身就有误导性。MIT 协议在开发者心中约等于「随便用」,加一个 Modified 前缀,很容易让人在没细看条款的情况下误以为限制不大。社区里已经有人直接把这称为「挂羊头卖狗肉」。

MiniMax 的苦衷:被「阉割版」坑怕了

事情如果只看到这里,MiniMax 就是一个「开源诈骗犯」的形象。但他们的回应值得认真听一下。

MiniMax 开发者关系负责人 Ryan Lee 在社交平台上发了一篇长文,解释了协议变更的原因。核心论点是:M2.5 时代的完全开放,让 MiniMax 吃了大亏。

具体来说,M2.5 发布后,大量第三方 API 平台开始托管 MiniMax 的模型。这本来是好事,说明模型有市场需求。问题在于,这些第三方提供的服务质量参差不齐:

  • 有的为了省显存做了过度量化(比如把 FP16 压到 INT4),精度严重下降
  • 有的用了错误的提示模板(prompt template),导致模型输出质量大打折扣
  • 最离谱的是,有平台直接挂着 MiniMax 的名字,实际跑的是其他更便宜的模型

用户在这些平台上体验到的是一个「残次品」,但他们不会去追究是哪个中间商的问题——他们只会觉得「MiniMax 的模型不行」。

"用户体验不佳,最后却觉得 MiniMax 水平一般,我们承担了口碑损失。完全宽松的开源协议让我们对此束手无策。" —— Ryan Lee

这个问题确实存在,而且不只是 MiniMax 一家的困扰。开源模型生态里,「套壳」和「降级部署」是普遍现象。你在某些 API 聚合平台上调用的所谓某某模型,实际跑的是什么,谁也说不准。

从这个角度看,MiniMax 的焦虑是真实的。但问题在于:用限制许可证来解决品牌保护问题,是不是选错了工具?

「伪开源」争议的本质

开发者社区的愤怒不仅仅是因为不能免费商用了。更深层的问题是:MiniMax 在享受「开源」带来的声誉红利的同时,实际上并没有提供开源应有的自由度。

这触及了 AI 行业一个越来越尖锐的矛盾。

按照 OSI(开源促进会)的定义,真正的开源许可证不能限制使用领域,也不能限制商业使用。从这个标准来看,M2.7 的 Modified-MIT 显然不符合开源定义。它更接近于一种「源码可见」(source-available)的许可模式——你能看到代码和权重,但不能随意使用。

但 AI 行业对「开源」这个词的使用一直很宽泛。Meta 的 Llama 有商用限制,照样自称开源;Google 的 Gemma 也有使用条款限制,同样以开源姿态发布。MiniMax 不过是把这种行业惯例推得更远了一步。

真正让开发者不满的是协议的倒退方向。从 MIT 到 Modified-MIT,这不是一个新项目选择了保守的许可证,而是一个已经建立了开放预期的项目突然收紧了规则。这就好比一家餐厅先用免费试吃吸引了一批回头客,等大家形成习惯后突然开始收费——即使收费本身合理,这个过程也会让人不舒服。

而且,MiniMax 的处理方式也有问题。据社区反馈,协议变更并没有在发布公告中被显著提及,不少开发者是在准备部署时才发现许可证变了。这种「悄悄改」的做法进一步加剧了信任危机。搜狐等媒体的报道标题直接用了「悄悄锁死」这样的措辞,可见外界观感之差。

品牌保护 vs. 开源自由:有没有更好的解法?

回到 MiniMax 提出的核心问题——如何防止第三方「阉割降级」损害品牌——这确实是一个合理的诉求。但限制商业使用并不是唯一的解法,甚至可能不是最好的解法。

业界已经有一些更成熟的做法:

  • 商标保护:保持 MIT 协议不变,但对「MiniMax」品牌名称进行商标注册和保护。第三方可以自由使用模型,但如果要用 MiniMax 的名字做宣传,必须满足质量标准。这是 Mozilla/Firefox 的经典做法——代码完全开源,但你不能随便用 Firefox 的名字和 logo。
  • 认证体系:建立官方认证机制,只有通过质量验证的部署才能使用「MiniMax Certified」标识。类似于 Kubernetes 的一致性认证。
  • 技术手段:在模型中嵌入水印或指纹,方便追踪和识别未经授权的修改版本。

这些方案都能在不限制商业使用的前提下保护品牌。选择直接限制许可证,更像是一种「简单粗暴」的解决方式——有效,但代价是失去开发者社区的信任。

对开发者的实际影响

说完争议,聊聊实际影响。如果你是开发者,M2.7 的协议变更对你意味着什么?

个人使用和学术研究不受影响。 Ryan Lee 明确表示,个人自托管用于代码编写「绝对允许」。如果你只是想在本地跑一个编程助手,或者做学术研究,M2.7 的许可证不会限制你。

商业使用需要走审批流程。 如果你打算把 M2.7 集成到商业产品中,你需要联系 MiniMax 获取书面授权。目前还不清楚审批流程有多复杂、是否收费、审批周期多长。这种不确定性本身就是一个成本。

微调后的模型同样受限。 这一点很关键。即使你在 M2.7 基础上做了大量微调,产出的模型仍然受 Modified-MIT 约束。这意味着你不能通过微调来「洗掉」许可证限制。

对于想要在生产环境中使用 MiniMax 模型能力的开发者来说,通过 API 调用反而是更省心的方式——不用操心许可证问题,也不用担心量化和部署带来的质量损失。OpenAI Hub 目前已经支持 MiniMax 系列模型的 API 调用,兼容 OpenAI 格式,国内可以直连,省去了自部署的各种麻烦。

如果你想快速试试 M2.7 的编程能力,可以直接通过 API 调用:

from openai import OpenAI

client = OpenAI(
    api_key="your-openai-hub-key",
    base_url="https://api.openai-hub.com/v1"
)

response = client.chat.completions.create(
    model="minimax-m2.7",
    messages=[
        {"role": "system", "content": "你是一个资深软件工程师。"},
        {"role": "user", "content": "帮我写一个 Python 装饰器,实现函数调用的自动重试,支持指定最大重试次数和指数退避策略。"}
    ],
    temperature=0.7
)

print(response.choices[0].message.content)

更大的图景:AI 开源正在分裂

MiniMax M2.7 的许可证风波不是孤立事件。它折射出整个 AI 行业在「开源」问题上日益加深的分裂。

一边是以 Mistral、Allen AI 为代表的「真开源」阵营,坚持使用 Apache 2.0 等标准开源许可证,不对商业使用做任何限制。另一边是越来越多的公司采用各种「类开源」许可证——权重公开、代码可见,但在商业使用上设置各种门槛。

Meta 的 Llama 系列是后者的典型代表。Llama 的许可证允许月活 7 亿以下的公司免费商用,超过这个门槛需要单独授权。这个条款实际上只限制了极少数超大型公司,对绝大多数开发者来说等于没有限制。相比之下,MiniMax 的 Modified-MIT 对所有商业用途一刀切地要求审批,限制范围要大得多。

这种趋势背后的逻辑不难理解。训练一个前沿大模型的成本动辄数千万甚至上亿美元,公司需要找到一种方式来回收投资。完全开源意味着竞争对手可以直接拿走你的成果,而完全闭源又无法获得开源社区带来的生态效应和品牌影响力。各种「类开源」许可证就是在这两个极端之间寻找平衡点。

问题在于,当每家公司都发明自己的许可证时,开发者面临的合规成本会急剧上升。你用了五个不同的开源模型,可能需要遵守五套不同的许可条款,每套都有自己的定义和边界。这对独立开发者和小团队来说是一个不小的负担。

我的判断

说说我的看法。

MiniMax 遇到的品牌保护问题是真实的,Ryan Lee 的解释也算坦诚。但选择用限制许可证来解决这个问题,是一个短视的决定。

原因很简单:开源模型的核心竞争力不是模型本身,而是围绕模型形成的开发者生态。 限制商业使用会直接打击开发者的积极性,尤其是那些最有可能为模型生态做贡献的商业开发者。你保护了品牌,但可能失去了生态。

而且,从实际效果来看,许可证限制对「套壳」和「降级部署」的约束力非常有限。那些会偷偷替换模型的平台,大概率也不会认真遵守许可证条款。真正被限制住的,反而是那些守规矩的开发者。

更好的做法是:保持宽松的开源协议,同时通过商标保护、认证体系和技术手段来解决品牌问题。这需要更多的投入和更精细的运营,但长期来看对生态建设更有利。

M2.7 的性能确实令人印象深刻,SWE-Pro 56.22% 的成绩说明 MiniMax 的技术实力不容小觑。但在开源这件事上,技术能力和社区信任同样重要。希望 MiniMax 能认真听取社区反馈,在后续版本中找到一个更好的平衡点。

毕竟,开源的价值不仅仅在于公开权重,更在于给予开发者真正的自由。


参考来源