芒果TV悄悄做起了大模型API生意:9个国产模型免费用到月底
这两天 linux.do 上有人甩出一条消息:芒果TV——对,就是那个播《明星大侦探》《乘风破浪的姐姐》的湖南卫视芒果TV——悄悄上线了一个 AIGC 开放平台,一次性接入了九个国产大模型,OpenAI 协议兼容,限时免费,截止日期就在明天,5 月 31 日。
发帖人原话是 "怕被误伤为引流,链接就不放了",配图是芒果 aigc.mgtv.com 后台的截图。我们去翻了一下文档,确认这事是真的:这不是哪家三方薅羊毛的中转,是芒果TV 官方域名下的开发者平台,文本生成和图片生成两条线都开了。
一家做长视频的公司,端着内容版权和会员收入的饭碗,突然跑去和云厂商、模型公司抢 API 调用的生意,这事本身就值得说道说道。

九个模型一次接入,平台抹平了差异
先说技术侧。芒果这次 API 的产品形态,本质上是个模型路由层:你拿一个 key,通过 model 字段切换不同的底层模型。从开发者反馈来看,接入的九个模型基本覆盖了国产第一梯队——DeepSeek、Qwen、GLM、Kimi、豆包、混元这些主流玩家都在里面,外加几个垂直方向的模型。
它强调的两件事:
- OpenAI 协议兼容。意味着如果你已经用 openai-python、openai-node 这套 SDK 写好了业务,理论上把
base_url改一行、api_key换一下、model名换一下就能跑。这是过去两年事实上的行业标准——谁不兼容 OpenAI 谁就别想拿到存量开发者。 - 限时免费。所有模型在 5 月 31 日之前可以白嫖,没有看到明确的 QPS 上限说明,但既然是公测期,限速大概率是存在的。
模型路由这个产品形态,2024 年开始就成了红海。从国外的 OpenRouter、Together AI,到国内的硅基流动、ppinfra,再到 OpenAI Hub 这类聚合平台,再到现在芒果TV 这种内容公司亲自下场,这条赛道里已经挤满了人。聚合层之所以有市场,核心是解决了两个开发者真实痛点:统一计费和单 key 多模型切换。一个稍微大点的 AI 应用,今天用 DeepSeek 跑长上下文、明天用 Qwen 跑代码、后天用 GLM 试试效果,如果每个模型都要单独申请额度、对账、维护一套鉴权,光是运维成本就能拖垮一个小团队。
一家长视频公司,为什么要做模型 API?
这才是这条新闻真正有意思的地方。
芒果TV 的主营业务从来不是 ToB 基础设施。它的护城河是版权综艺、自制剧、湖南卫视的内容供给链。做模型 API,意味着它要去和阿里云、火山引擎、腾讯云这些工程能力深厚得多的对手抢市场——表面上看完全不在一个生态位。
但仔细想,逻辑是通的:
第一,内部用量本来就在那里。 长视频平台是 AIGC 应用的天然大户:剧本辅助、综艺策划、弹幕审核、智能剪辑、海报生成、短视频二创、用户评论摘要、客服问答——每一项都是大模型可以切入的场景。芒果内部要烧的 token 不是小数目,与其每个月给云厂商交保护费,不如自己搭一层中间件,对内是成本中心,对外顺手开放就是新业务。这套打法和当年 AWS 从亚马逊电商内部基础设施长出来的故事是同一个脚本。
第二,2026 年国产模型已经卷成白菜价。年初 DeepSeek V3.2、Qwen3 系列、GLM 4.5 这些主力模型的官方 API 价格已经压到了一个非常低的水位,再往下挤利润空间不大,但走量的空间还很大。模型厂商其实非常乐意通过聚合渠道把调用量做起来——直接 ToC 卖 API 是一门重运营的生意,但通过几个聚合分销商铺货就轻得多。芒果有流量、有 ToC 用户认知、有付费心智,进来分一杯羹理论上不算太离谱。
第三,AIGC 内容生产链条本身在重构。芒果想做的可能不是单纯卖 API 调用,而是绑定一套面向内容创作者的 AI 生产工具链——从剧本到分镜到海报到剪辑。API 只是入口,往后是工作流、是 SaaS、是创作社区。这条路阿里云、字节都在走,但芒果的优势在于离 "内容" 更近、离 "创作者" 更近。

限时免费的算盘
"免费到 5 月 31 日" 这个表述需要拆开看。
这是一个非常典型的冷启动获客动作:在公测期免费,让开发者把代码接进来、把业务跑起来、把数据沉淀下来——一旦切换成本形成,6 月 1 日开始计费的时候,用户的迁移意愿就会显著下降。这套打法所有云厂商都用过,没什么新意,但确实有效。
对开发者来说,需要冷静评估几件事:
- 稳定性未知。芒果毕竟是新玩家,模型路由这种活看起来简单,但要把 9 个上游模型的限流策略、错误码、流式响应、function calling 各种细节处理好,工程量并不小。前两周接入的开发者反馈里已经有人提到偶尔的 502 和限速触发。
- 收费策略不明。文档里目前还没看到 5 月 31 日之后的计费表。如果芒果直接按上游模型官方价透传,那它就是个亏本搬运工;如果加价,那就要和直接对接官方 API、以及和其他更成熟的聚合平台拼性价比。
- 数据合规问题。芒果是持牌的内容平台,监管口径比纯技术公司可能更敏感一些。把企业的业务 prompt 灌进去之前,最好确认一下数据留存策略,特别是涉及 ToC 用户数据的场景。
这事对开发者意味着什么
从开发者视角,这条新闻有三个层面的信号:
第一个层面,免费的羊毛。如果你恰好需要做一些模型对比测试、批量数据处理、或者跑一些不那么紧急但量比较大的离线任务,那截止到 5 月 31 日之前的这一周左右,确实可以薅一把。OpenAI 协议兼容意味着接入成本极低,调用代码大致是这样的形式:
from openai import OpenAI
client = OpenAI(
api_key="你在芒果AIGC平台申请的key",
base_url="https://aigc.mgtv.com/v1" # 以官方文档为准
)
resp = client.chat.completions.create(
model="deepseek-v3", # 或 qwen、glm、kimi 等
messages=[{"role": "user", "content": "用一句话解释什么是Transformer"}]
)
print(resp.choices[0].message.content)
注意上面只是示意,具体模型名、endpoint 路径要去查芒果官方文档,不同模型的支持参数也有差异。
第二个层面,市场信号。当一个长视频公司都觉得 "做模型 API 聚合" 是值得入场的赛道,说明这门生意的入场门槛和技术壁垒已经低到了一定程度——大模型作为基础设施,正在快速 commoditize。这对独立模型厂商不是好消息,但对应用层开发者是绝对的利好:底层供给越同质化、越廉价,上层创造空间就越大。
第三个层面,聚合层的洗牌还没结束。国内目前能稳定提供多模型 API 的聚合服务,已经有十几家。芒果加入只是把队伍又拉长了一点。对开发者来说,挑聚合平台不外乎四个维度:模型覆盖度、价格、稳定性、增值服务(比如缓存、批量、监控、key 管理)。芒果短期靠免费切入,长期能不能站住,要看它能不能在后三个维度上做出差异化。OpenAI Hub 这类聚合服务能够同时支持 GPT、Claude、Gemini、DeepSeek 等海内外主流模型,国内直连且兼容 OpenAI 格式,覆盖度上明显比单纯做国产模型聚合的平台更广,这也是开发者在选型时会权衡的点。
一个略带讽刺的观察
2023 年模型这一波刚起来的时候,所有人都在赌大模型公司本身会成为 AI 时代的水电煤。两年半过去,真实的格局是:模型层已经在快速通用化,护城河变浅;真正赚到钱的反而是中间的分发层——API 聚合、Agent 框架、向量数据库、IDE 插件这些 "中间商"。
芒果TV 做模型 API 这件事,与其说是芒果在跨界,不如说是国产大模型生态成熟到了一个新阶段:连内容公司都看明白了,自己烧 token 不如顺便卖 token。再往下走半年,可能我们会看到更多非典型玩家入场——电商、社交、出行平台,谁手里都攥着一堆 AIGC 需求和一群现成的开发者用户,转手做个 API 聚合并不奇怪。
这是一个对开发者好、但对纯模型厂商不太友好的趋势。免费窗口期还有最后一天,要薅的赶紧。
参考来源
- linux.do 论坛原帖:芒果偷偷上线的大模型 API - 首次披露该平台的开发者社区帖子,包含截图与使用反馈