微软终于有自己的推理模型了
北京时间 6 月 3 日凌晨,Build 2026 开场半小时,纳德拉把话筒交给 Mustafa Suleyman,后者甩出了一份让外界等了大半年的清单:MAI-Thinking-1、MAI-Image 2.5、MAI-Transcribe-1.5、MAI-Voice-2、MAI-Code-1,一口气五款自研模型。其中真正的主角,是那个挂着 "Thinking" 后缀的家伙——微软第一款自研高级推理模型。
这事的重要性不在于参数有多大、跑分有多漂亮,而在于一句话:微软终于有了一个不靠 OpenAI、也不靠任何第三方模型蒸馏出来的推理模型。在两家公司今年年初刚刚重新谈判完合作条款、关系明显松绑的背景下,这一发布的政治意味,比技术意味还重。

"中等规模"、"未蒸馏",这两个词都得拆开看
微软官方对 MAI-Thinking-1 的定位非常克制:a medium-sized model,在关键软件工程基准上 "matches leading models"。没有给具体参数,没有公布完整 benchmark 表,也没有像隔壁 Anthropic、Google 那样放一长串 SWE-bench、AIME、GPQA 数字。
但这两个用词其实信息量很大。
"中等规模"——微软去年内部有过传闻中的 MAI-1(约 5000 亿参数),但 Thinking-1 显然不走那条堆参数路线。结合微软这两年一直在 Phi 系列上死磕 "small but mighty",MAI-Thinking-1 大概率是几百亿参数级别、配合大量推理时计算(test-time compute)的产物。Suleyman 在台上反复强调 "推理效率",这与 OpenAI o 系列、Anthropic 的 extended thinking 路线类似——靠思维链把性能挤出来,而不是无脑堆 size。
"未蒸馏第三方模型"——这话听起来政治正确,背后其实是行业里大家心照不宣的事。过去两年,大量号称自研的模型,训练集里多少都有 GPT-4、Claude 输出的影子,要么直接 distill,要么用合成数据洗一遍。微软这次特意把 "trained from the ground up on clean data" 写进官方稿,是要明确告诉投资人和监管:我们的模型版权和能力来源都干净,不依赖 OpenAI。这对正在重新谈判股权和 IP 归属的微软-OpenAI 联盟来说,是一个相当强硬的姿态。
软件工程基准对标头部——这话该怎么读
微软自己挑的赛道是 software engineering。这不奇怪,GitHub 在它手里,Copilot 的反馈闭环全行业最完整,做编码相关的推理模型,它有先天数据优势。
但 "matches leading models on key benchmarks" 这种表述要谨慎对待。我的判断是:
- SWE-bench Verified 上大概率能进第一梯队,但未必超过 Claude Sonnet 4.5 或 GPT-5 系列的最新版本。
- 在通用推理(数学、科学问答)上,微软没有强调,意味着可能没有特别亮眼的成绩。
- 真正的杀手锏在产品集成:MAI-Thinking-1 会先在 GitHub Copilot 的 Agent 模式里替换掉部分原本调用 OpenAI 的链路。
换句话说,微软不是要去做一个 "全能型选手",而是先在自己最有数据飞轮的场景里,把一个 "够用、可控、便宜" 的自研模型跑通。这是非常工程化、非常微软的打法。
同场发布的另外四款,把 MAI 家族补齐了
Thinking-1 是头条,但同场公布的其他四款模型才是让 MAI 家族从 "实验项目" 变成 "产品矩阵" 的关键:
| 模型 | 定位 | 关键卖点 |
|---|---|---|
| MAI-Image 2.5 / Flash | 文生图 + 图像编辑 | 双版本覆盖质量与速度 |
| MAI-Transcribe-1.5 | 语音转写 | 速度号称是竞品 5 倍 |
| MAI-Voice-2 | 语音合成 | 新增 15 种语言,Flash 版即将上线 |
| MAI-Code-1 | 代码生成 | 推理效率优化,已进 Copilot 和 VS Code |
看出门道了吗?这套组合刚好对应了一个完整的 AI 应用栈:理解(Transcribe)→ 推理(Thinking)→ 生成(Image / Voice / Code)。微软不是在零散发模型,而是在搭一个不依赖 OpenAI 也能跑完整 Copilot 体验的备胎栈。
MAI-Transcribe-1.5 那个 "5 倍速度" 的说法挺有意思。如果属实,对标的应该是 OpenAI 的 Whisper Large v3 或 Gemini 的语音 API。考虑到 Teams、Office、Azure Communication Services 里有海量语音转写需求,每秒一分钱的成本差,乘上微软的体量就是真金白银。
MAI-Code-1 强调 "推理效率优化",并且 "已集成到 GitHub Copilot 和 VS Code 中"——这意味着用户其实已经在用了,只是不知道。Copilot 背后的模型路由,这两年早就是个混合体,OpenAI、自研、开源开源微调全都有。MAI-Code-1 的上线,进一步把 OpenAI 的份额往下挤。
微软为什么非得自研,这是个老问题但有新答案
两年前问这个问题,标准答案是:"不能把命脉押在 OpenAI 身上"。今天再问,答案多了几层:
第一,成本。 Copilot 系列每月 30 美元的订阅,推理成本一度让微软自己都肉疼。Suleyman 接管微软 AI 后多次公开说过,团队的核心 KPI 之一就是 "把每 token 成本打下来"。自研中等规模模型 + 推理优化,是直接砍成本的最短路径。
第二,监管和 IP。 欧盟 AI Act、英国 CMA 的反垄断审查、美国 FTC 对微软-OpenAI 关系的盯梢,都在逼微软证明自己 "独立"。一个完全 clean-room 训出来的模型,是这种证明里最硬的物证。
第三,产品节奏。 调 OpenAI API 的话,新功能、新版本要等对方的发版节奏;自研之后,Copilot 想给客户加什么特性,可以直接改模型。这对 to B 业务尤其重要,企业客户要的是定制和 SLA。
第四,也是 Suleyman 本人的赌注。 从 DeepMind 联创到 Inflection CEO 再到微软 AI 负责人,他这一路被外界盯着的一直是 "什么时候能拿出真正属于自己的模型"。MAI-Thinking-1 是他在微软第二年的成绩单。
但也别高估,几个冷静的判断
作为长期跟踪这个赛道的人,我想补几个克制的判断:
MAI-Thinking-1 不会替代 OpenAI 模型在 Copilot 里的位置,至少短期不会。GPT-5 系列仍然是 Copilot 顶配体验的底座,MAI 系列更多是处理中低复杂度任务、节省成本。
"未蒸馏" 不等于 "未使用合成数据"。微软完全可以用自己的模型、规则系统、检索结果造数据,这在技术上不构成第三方蒸馏,但效果差距未必那么大。这一点等技术报告出来再判断。
基准测试 "matches" 是个含糊词。直到第三方在独立环境复现之前,最好把这句话理解为 "在某些子集上接近"。微软自己也没说 SOTA。
真正决定 MAI 系列命运的是 API 开放程度。如果只是 Copilot 内部用,那它就是个内部工具;如果通过 Azure AI Foundry 开放给开发者,并定价低于同档 OpenAI 模型,才会真正动摇生态。目前微软没明说后者,但暗示了 "未来几周内" 会有更多消息。
对开发者意味着什么
如果你在做基于 Copilot 或 Azure OpenAI 的应用,短期内 API 接口不会有任何变化,但底层模型可能已经被悄悄换成了 MAI 系列。延迟、成本、风格上会有微妙差异,建议关注:
- Azure OpenAI Service 的模型列表里,未来几周是否出现
mai-thinking-1之类的 model ID - GitHub Copilot 的模型选择器里是否新增微软自研选项(去年已经支持 Claude 和 Gemini,再加自家的不奇怪)
- 定价页:如果 MAI-Thinking-1 的单价显著低于 GPT-5-mini 这种档位,那对成本敏感型应用就是个真选项
对国内开发者来说,MAI 系列大概率不会单独出海发到非微软渠道,最现实的接入路径还是通过 Copilot 产品和 Azure。如果你习惯用一个 Key 同时调多家模型做对比测试,OpenAI Hub 这类聚合平台一旦上架 MAI 系列,会比单独开 Azure 账号方便很多——值得等几周看动静。
写在最后
微软的 AI 故事,过去几年一直是 "OpenAI 的最大金主和最大客户"。从 MAI-1 到 MAI-Thinking-1,这家公司用了大概两年时间,把 "我们也能自己做" 从 PR 口号变成了产品矩阵。这不会让 OpenAI 一夜之间失去价值,但它确实改变了双方在牌桌上的筹码分布。
2026 年下半年最值得看的,不是 Thinking-1 的跑分能不能再爬几个点,而是微软会不会把这套自研栈打包成 Azure 上一个真正独立、可商用的模型服务。如果会,那才是 OpenAI 真正需要紧张的时刻。
参考来源
- 微软发布其首款高级推理模型 MAI-Thinking-1:承诺未蒸馏第三方模型,自研 AI 模型阵容进一步扩充 - IT之家:Build 2026 现场发布详情与 MAI 全家桶汇总
- 微软首个自研推理 AI 模型 MAI-Thinking-1、新 Copilot 超级应用曝光 - IT之家:发布会前的爆料与 Copilot 超级应用截图分析