腾讯云下调 MiniMax-M3 与 Hy-MT2-Pro API 价格，最高降幅 66.67%

6月12日起，腾讯云 TokenHub 将 Hy-MT2-Pro 输入价格下调 66.67%、输出下调 55.56%；6月15日起，MiniMax-M3 推理输入、输出、缓存命中费用全部砍掉一半。在整个行业普遍停止降价甚至涨价的当下，腾讯这一手颇有看头。

腾讯云今天甩出了一份价格调整公告，对开发者来说是个不大不小的好消息：大模型服务平台 TokenHub 即将下调两款主力模型的 API 价格——Hy-MT2-Pro 从今天（6 月 12 日）起，输入价格降 66.67%、输出价格降 55.56%；MiniMax-M3 从 6 月 15 日起，推理输入、推理输出、缓存命中费用统统砍一半。

按 TokenHub 现行价目表算账，Hy-MT2-Pro 原本的定价是输入 1.5 元/百万 tokens、输出 4.5 元/百万 tokens，调价之后大致落在输入 0.5 元、输出 2 元/百万 tokens 的水平。这个价位在国内厂商的中端 Pro 系列里属于第一梯队的便宜——比阿里 Qwen-Plus 的非思考档便宜，跟字节豆包 1.6 短文本档拉到了同一条线上。MiniMax-M3 这边官方只说了"全部下调 50%"，没披露调价后的绝对值，但按这个幅度算，已经能跟开源模型的托管价正面竞争了。

行业都在涨价，腾讯反着来

要理解这次降价的分量，得把镜头拉远一点看。

2024 年那场轰轰烈烈的大模型价格战，主角是字节、阿里、百度、腾讯、智谱们，输入价格一度被打到几毛钱每百万 tokens。但进入 2025 年之后，整个行业的画风开始反转：DeepSeek 在 9 月取消了夜间优惠，最低调用价直接拉高 50%；智谱 GLM-4.5 的高速版输出价飙到 64 元/百万 tokens；月之暗面 Kimi K2 在 128K 长文本场景下又把高速档拉回 64 元；MiniMax-M1 推理模型最高定价 24 元输出。

更狠的是腾讯自己。今年 3 月，腾讯云智能体开发平台对部分混元模型的计费策略动手，HY2.0 Instruct、HY2.0 Think 的输入输出涨幅普遍在 4 倍以上，Tencent HY2.0 Instruct 输入价从 0.0008 元/千 tokens 调到 0.004505 元/千 tokens，涨幅 463.13%。彼时财联社的报道用的标题就是"涨幅高达 400%"。

所以你能看出来，国内大厂这两年对待 API 定价的态度，已经从"以价换量"变成了"分层精细化"——通过阶梯定价、思考与非思考模式分档、超长上下文加价等手段，把高价值用户从普惠定价里挑出来单独算账。腾讯这次反过来给两款主力模型降价，在大背景下算是个小逆流。

为什么是这两款模型

挑选 Hy-MT2-Pro 和 MiniMax-M3 来调价，并不是随手抽签。

Hy-MT2-Pro 是腾讯自家混元系列的中端 Pro 档，从命名看是 MT（Multi-Task 或 Multi-modal Translation 一类）2 代的 Pro 版本。它在 TokenHub 模型价目表上属于不分输入长度档位的统一定价——这种结构通常意味着模型上下文窗口不超长（一般 32K 量级），主打的就是高频、稳定、中等复杂度的场景。降价之后，这款模型直接奔着翻译、内容生成、摘要这类高调用量场景去了。65% 以上的输入降幅，配合 55% 的输出降幅，意味着对那些"输入多输出少"的检索增强类应用（RAG）尤其友好。

MiniMax-M3 则是腾讯云上托管的第三方旗舰模型。MiniMax 自家 abab-6.5s 早期降到 1 元/百万 tokens 的疯狂定价时代过去后，新一代 Text-01、M1 的定价都在往上走。腾讯云这次直接砍 50%，等于是用平台补贴把第三方旗舰拉回到平民价位，这是典型的渠道竞争策略——你在 MiniMax 官方调贵，那就来腾讯云调便宜的。

这种"平台代理价低于原厂"的现象，在 DeepSeek 那边也能看到：TokenHub 上 DeepSeek-V4-Flash 的原厂直供价缓存命中是 0.02 元/百万 tokens，平台自托管的同款是 0.2 元/百万 tokens。两套并行，留给开发者自己选——要稳定走原厂，要便宜走平台。

对开发者意味着什么

站在用 API 干活的角度，这次调价有几个实际的影响：

缓存命中费用同样砍半这件事比表面看起来重要。对长系统提示词、固定 Few-shot 模板、Agent 工作流这类"前缀重复度极高"的场景，缓存命中费用是真正的大头。降一半相当于直接把生产环境的月度账单往下拉一截。
输入降幅大于输出是 Hy-MT2-Pro 调价的鲜明特征。输入降 66.67%、输出降 55.56%，这种非对称降价显然是在鼓励长上下文输入。换句话说，腾讯希望你拿这个模型做 RAG、做长文档处理、做大段代码审查，而不是聊天。
Hy-MT2-Pro 调价当天生效，MiniMax-M3 三天后生效——这个时间差给你留出了观察窗口。可以先把 Hy-MT2-Pro 接进去跑一轮 A/B，等 6 月 15 日 MiniMax-M3 同步调价后再决定主力路由。

API 价格调整前后对比图

腾讯的算盘：把混元卖出去

聪明的开发者应该已经注意到一个细节：Hy-MT2-Pro 是腾讯自家模型，MiniMax-M3 是第三方。两款同时降，但腾讯对自家模型的降幅更激进——输入直接砍掉三分之二。

这个动作背后的逻辑链很清晰。

腾讯混元这两年一直在做架构层面的成本优化。混元 TurboS 用了 Transformer + Mamba 混合架构，把长序列处理的算力开销压下来；今年 3 月发布之后定价就直接拉到了输入 0.8 元、输出 2 元/百万 tokens 的低位。Hy-MT2-Pro 作为更新一代的 Pro 系列，理论上推理成本进一步下降，所以这次有底气把降价幅度打到 60% 以上。

从智东西此前那篇行业分析也能看出来：腾讯是国内几家大厂中少数仍在逐渐下调大模型 API 价格的企业。混元 Turbo 从 2024 年 9 月发布时的输入 15 元/输出 50 元，已经降到了现在的 2.4 元/9.6 元，TurboS 更低。这种持续降价的姿态，跟其他厂商的精细化分层定价形成了鲜明对比。

说白了，腾讯云想抢的是"开发者默认调用"这块阵地。当 OpenAI、Anthropic 的 API 都卡在 11-15 美元/百万 tokens 不下来、订阅方案集体奔 200 美元/月而去的时候，国内云厂商如果还在跟着涨，开发者就没有理由不去抠那点性价比。而腾讯云手上有 TokenHub 这个聚合平台、有自研混元、有 DeepSeek 原厂直供、有 MiniMax/智谱/Qwen 全家桶，它降价的边际成本，比 MiniMax 这种纯模型厂商低得多。

Token 通胀和成本控制的双面夹击

但降价并不是孤立的故事。它发生在一个非常诡异的时间点上：Token 消耗量正在爆炸式增长，而厂商的算力账本却越来越难看。

根据公开数据，中国整体日均 Token 消耗在 2025 年中突破 30 万亿，2026 年 2 月主流大模型合计日均 Token 消耗已经到 180 万亿级别——半年多翻了 6 倍。Anthropic 上个月不得不取消 Claude Code 200 美元/月订阅的无限调用权限，原因是有用户 7×24 跑 Agent，单人月度成本达到"数万美元"。

这就形成了一个矛盾局面：

一方面，Agent、长上下文、多工具调用让单任务 Token 用量飙升，开发者对降价的需求空前强烈；
另一方面，模型推理本身的成本——GPU 租赁价格在 H100 每卡时 2-3 美元区间稳定下来后不再下降，加上电力、数据授权、人才薪资三座大山，让厂商的边际成本几乎没法继续往下压。

所以腾讯这次降价，对开发者是利好，但本质上是"用平台规模化摊薄成本 + 用补贴换市场份额"的组合拳。这种打法能持续多久，要看接下来几个季度 Hy-MT2-Pro 的调用量增长能不能跟上。如果只是图便宜来了一批薅羊毛用户，没转化成稳定的 B 端订单，那么明年这个时候我们多半会看到下一轮分层定价的回调。

一些实操建议

对正在选型或者准备迁移的开发者，几条建议：

如果你的工作负载里大量调用 MiniMax-M3，6 月 15 日之前可以先把腾讯云 TokenHub 的接入跑通，调价当天就能切流量；
Hy-MT2-Pro 适合做轻量翻译、内容审核、结构化提取这类"输入多输出少"的任务，降价后的性价比在国产 Pro 档里很有竞争力；
如果你做 Agent 或者 RAG，重点关注缓存命中价的变化——MiniMax-M3 缓存命中砍半之后，长系统提示词的开销会显著下降；
不要只看单价，国内厂商现在的定价越来越复杂，输入长度档位、思考/非思考模式、并发限制都会影响实际账单。建议拿真实业务流量跑一周对比，再决定主力路由。

对于一个 Key 调用多家模型的开发者来说，类似 OpenAI Hub（openai-hub.com）这种聚合服务也能省掉切换平台的工程成本——尤其当你的应用同时用 GPT、Claude、Gemini 加上国产模型时，避免维护多套 SDK 和计费体系本身就是降本。

收尾

大模型价格战的剧本，在 2025 年之后变得越来越复杂。表面上厂商们都在说"智能成本会持续下降"，实际上海外旗舰 API 价格原地踏步、订阅档全面奔向 200 美元，国内厂商也开始分层涨价。

在这种背景下，腾讯云对 Hy-MT2-Pro 和 MiniMax-M3 这次相对干脆的降价，算是给开发者吃了颗定心丸——至少在中端模型这一档，价格还有往下走的空间。但别太乐观，旗舰模型的定价天花板，还远远没到松动的时候。

参考来源

（本文信息综合自腾讯云 TokenHub 官方公告、36氪及财联社等公开报道整理。）

腾讯云逆势降价：MiniMax-M3 砍半，Hy-MT2-Pro 输入价降近七成

行业都在涨价，腾讯反着来

为什么是这两款模型

对开发者意味着什么

腾讯的算盘：把混元卖出去

Token 通胀和成本控制的双面夹击

一些实操建议

收尾

参考来源

相关推荐

英特尔砍掉BigDL：开源AI框架6月底归档

长安甩出"天枢领航"：把VLM塞进辅助驾驶，启源Q06九月上市

华为发了个 DevEco Code，把鸿蒙开发塞进了 Agent

联系我们