AI 快讯腾讯云逆势降价:MiniMax-M3 砍半,Hy-MT2-Pro 输入价降近七成
产品更新

腾讯云逆势降价:MiniMax-M3 砍半,Hy-MT2-Pro 输入价降近七成

2026-06-12T11:11:12.970Z
腾讯云逆势降价:MiniMax-M3 砍半,Hy-MT2-Pro 输入价降近七成

6月12日起,腾讯云 TokenHub 将 Hy-MT2-Pro 输入价格下调 66.67%、输出下调 55.56%;6月15日起,MiniMax-M3 推理输入、输出、缓存命中费用全部砍掉一半。在整个行业普遍停止降价甚至涨价的当下,腾讯这一手颇有看头。

腾讯云今天甩出了一份价格调整公告,对开发者来说是个不大不小的好消息:大模型服务平台 TokenHub 即将下调两款主力模型的 API 价格——Hy-MT2-Pro 从今天(6 月 12 日)起,输入价格降 66.67%、输出价格降 55.56%;MiniMax-M3 从 6 月 15 日起,推理输入、推理输出、缓存命中费用统统砍一半

按 TokenHub 现行价目表算账,Hy-MT2-Pro 原本的定价是输入 1.5 元/百万 tokens、输出 4.5 元/百万 tokens,调价之后大致落在输入 0.5 元、输出 2 元/百万 tokens 的水平。这个价位在国内厂商的中端 Pro 系列里属于第一梯队的便宜——比阿里 Qwen-Plus 的非思考档便宜,跟字节豆包 1.6 短文本档拉到了同一条线上。MiniMax-M3 这边官方只说了"全部下调 50%",没披露调价后的绝对值,但按这个幅度算,已经能跟开源模型的托管价正面竞争了。

行业都在涨价,腾讯反着来

要理解这次降价的分量,得把镜头拉远一点看。

2024 年那场轰轰烈烈的大模型价格战,主角是字节、阿里、百度、腾讯、智谱们,输入价格一度被打到几毛钱每百万 tokens。但进入 2025 年之后,整个行业的画风开始反转:DeepSeek 在 9 月取消了夜间优惠,最低调用价直接拉高 50%;智谱 GLM-4.5 的高速版输出价飙到 64 元/百万 tokens;月之暗面 Kimi K2 在 128K 长文本场景下又把高速档拉回 64 元;MiniMax-M1 推理模型最高定价 24 元输出。

更狠的是腾讯自己。今年 3 月,腾讯云智能体开发平台对部分混元模型的计费策略动手,HY2.0 Instruct、HY2.0 Think 的输入输出涨幅普遍在 4 倍以上,Tencent HY2.0 Instruct 输入价从 0.0008 元/千 tokens 调到 0.004505 元/千 tokens,涨幅 463.13%。彼时财联社的报道用的标题就是"涨幅高达 400%"。

所以你能看出来,国内大厂这两年对待 API 定价的态度,已经从"以价换量"变成了"分层精细化"——通过阶梯定价、思考与非思考模式分档、超长上下文加价等手段,把高价值用户从普惠定价里挑出来单独算账。腾讯这次反过来给两款主力模型降价,在大背景下算是个小逆流。

为什么是这两款模型

挑选 Hy-MT2-Pro 和 MiniMax-M3 来调价,并不是随手抽签。

Hy-MT2-Pro 是腾讯自家混元系列的中端 Pro 档,从命名看是 MT(Multi-Task 或 Multi-modal Translation 一类)2 代的 Pro 版本。它在 TokenHub 模型价目表上属于不分输入长度档位的统一定价——这种结构通常意味着模型上下文窗口不超长(一般 32K 量级),主打的就是高频、稳定、中等复杂度的场景。降价之后,这款模型直接奔着翻译、内容生成、摘要这类高调用量场景去了。65% 以上的输入降幅,配合 55% 的输出降幅,意味着对那些"输入多输出少"的检索增强类应用(RAG)尤其友好。

MiniMax-M3 则是腾讯云上托管的第三方旗舰模型。MiniMax 自家 abab-6.5s 早期降到 1 元/百万 tokens 的疯狂定价时代过去后,新一代 Text-01、M1 的定价都在往上走。腾讯云这次直接砍 50%,等于是用平台补贴把第三方旗舰拉回到平民价位,这是典型的渠道竞争策略——你在 MiniMax 官方调贵,那就来腾讯云调便宜的。

这种"平台代理价低于原厂"的现象,在 DeepSeek 那边也能看到:TokenHub 上 DeepSeek-V4-Flash 的原厂直供价缓存命中是 0.02 元/百万 tokens,平台自托管的同款是 0.2 元/百万 tokens。两套并行,留给开发者自己选——要稳定走原厂,要便宜走平台。

对开发者意味着什么

站在用 API 干活的角度,这次调价有几个实际的影响:

  • 缓存命中费用同样砍半这件事比表面看起来重要。对长系统提示词、固定 Few-shot 模板、Agent 工作流这类"前缀重复度极高"的场景,缓存命中费用是真正的大头。降一半相当于直接把生产环境的月度账单往下拉一截。
  • 输入降幅大于输出是 Hy-MT2-Pro 调价的鲜明特征。输入降 66.67%、输出降 55.56%,这种非对称降价显然是在鼓励长上下文输入。换句话说,腾讯希望你拿这个模型做 RAG、做长文档处理、做大段代码审查,而不是聊天。
  • Hy-MT2-Pro 调价当天生效,MiniMax-M3 三天后生效——这个时间差给你留出了观察窗口。可以先把 Hy-MT2-Pro 接进去跑一轮 A/B,等 6 月 15 日 MiniMax-M3 同步调价后再决定主力路由。

API 价格调整前后对比图

腾讯的算盘:把混元卖出去

聪明的开发者应该已经注意到一个细节:Hy-MT2-Pro 是腾讯自家模型,MiniMax-M3 是第三方。两款同时降,但腾讯对自家模型的降幅更激进——输入直接砍掉三分之二。

这个动作背后的逻辑链很清晰。

腾讯混元这两年一直在做架构层面的成本优化。混元 TurboS 用了 Transformer + Mamba 混合架构,把长序列处理的算力开销压下来;今年 3 月发布之后定价就直接拉到了输入 0.8 元、输出 2 元/百万 tokens 的低位。Hy-MT2-Pro 作为更新一代的 Pro 系列,理论上推理成本进一步下降,所以这次有底气把降价幅度打到 60% 以上。

从智东西此前那篇行业分析也能看出来:腾讯是国内几家大厂中少数仍在逐渐下调大模型 API 价格的企业。混元 Turbo 从 2024 年 9 月发布时的输入 15 元/输出 50 元,已经降到了现在的 2.4 元/9.6 元,TurboS 更低。这种持续降价的姿态,跟其他厂商的精细化分层定价形成了鲜明对比。

说白了,腾讯云想抢的是"开发者默认调用"这块阵地。当 OpenAI、Anthropic 的 API 都卡在 11-15 美元/百万 tokens 不下来、订阅方案集体奔 200 美元/月而去的时候,国内云厂商如果还在跟着涨,开发者就没有理由不去抠那点性价比。而腾讯云手上有 TokenHub 这个聚合平台、有自研混元、有 DeepSeek 原厂直供、有 MiniMax/智谱/Qwen 全家桶,它降价的边际成本,比 MiniMax 这种纯模型厂商低得多。

Token 通胀和成本控制的双面夹击

但降价并不是孤立的故事。它发生在一个非常诡异的时间点上:Token 消耗量正在爆炸式增长,而厂商的算力账本却越来越难看

根据公开数据,中国整体日均 Token 消耗在 2025 年中突破 30 万亿,2026 年 2 月主流大模型合计日均 Token 消耗已经到 180 万亿级别——半年多翻了 6 倍。Anthropic 上个月不得不取消 Claude Code 200 美元/月订阅的无限调用权限,原因是有用户 7×24 跑 Agent,单人月度成本达到"数万美元"。

这就形成了一个矛盾局面:

  • 一方面,Agent、长上下文、多工具调用让单任务 Token 用量飙升,开发者对降价的需求空前强烈;
  • 另一方面,模型推理本身的成本——GPU 租赁价格在 H100 每卡时 2-3 美元区间稳定下来后不再下降,加上电力、数据授权、人才薪资三座大山,让厂商的边际成本几乎没法继续往下压。

所以腾讯这次降价,对开发者是利好,但本质上是"用平台规模化摊薄成本 + 用补贴换市场份额"的组合拳。这种打法能持续多久,要看接下来几个季度 Hy-MT2-Pro 的调用量增长能不能跟上。如果只是图便宜来了一批薅羊毛用户,没转化成稳定的 B 端订单,那么明年这个时候我们多半会看到下一轮分层定价的回调。

一些实操建议

对正在选型或者准备迁移的开发者,几条建议:

  1. 如果你的工作负载里大量调用 MiniMax-M3,6 月 15 日之前可以先把腾讯云 TokenHub 的接入跑通,调价当天就能切流量;
  2. Hy-MT2-Pro 适合做轻量翻译、内容审核、结构化提取这类"输入多输出少"的任务,降价后的性价比在国产 Pro 档里很有竞争力;
  3. 如果你做 Agent 或者 RAG,重点关注缓存命中价的变化——MiniMax-M3 缓存命中砍半之后,长系统提示词的开销会显著下降;
  4. 不要只看单价,国内厂商现在的定价越来越复杂,输入长度档位、思考/非思考模式、并发限制都会影响实际账单。建议拿真实业务流量跑一周对比,再决定主力路由。

对于一个 Key 调用多家模型的开发者来说,类似 OpenAI Hub(openai-hub.com)这种聚合服务也能省掉切换平台的工程成本——尤其当你的应用同时用 GPT、Claude、Gemini 加上国产模型时,避免维护多套 SDK 和计费体系本身就是降本。

收尾

大模型价格战的剧本,在 2025 年之后变得越来越复杂。表面上厂商们都在说"智能成本会持续下降",实际上海外旗舰 API 价格原地踏步、订阅档全面奔向 200 美元,国内厂商也开始分层涨价。

在这种背景下,腾讯云对 Hy-MT2-Pro 和 MiniMax-M3 这次相对干脆的降价,算是给开发者吃了颗定心丸——至少在中端模型这一档,价格还有往下走的空间。但别太乐观,旗舰模型的定价天花板,还远远没到松动的时候。

参考来源

(本文信息综合自腾讯云 TokenHub 官方公告、36氪及财联社等公开报道整理。)

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: