阿里云百炼首发接入DeepSeek-V4,价格战打到底

产品更新

阿里云百炼平台今日首发上线 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash,API 定价与 DeepSeek 官网完全一致,Flash 版本低至 1 元/百万 Tokens 输入。百炼作为「模型超市」的生态卡位意图明显。

阿里云百炼首发接入 DeepSeek-V4,API 定价与官网一致——「模型超市」的生态卡位战

4 月 24 日,阿里云百炼平台宣布首发上线 DeepSeek-V4 系列模型,包括 DeepSeek-V4-ProDeepSeek-V4-Flash 两款。API 定价与 DeepSeek 官网完全一致,没有任何溢价。

这条消息本身不复杂,但背后的信号值得拆开来看。


先说模型:DeepSeek-V4 到底升级了什么

DeepSeek-V4 是深度求索在 V3 系列之后的重大迭代。两款模型的定位很清晰:

  • DeepSeek-V4-Pro:面向复杂推理、长链条任务,是旗舰级选手
  • DeepSeek-V4-Flash:走高效经济路线,适合高并发、对成本敏感的场景

两款模型都支持 100 万 Tokens 的超长上下文。这个数字在半年前还是少数顶级闭源模型的特权,现在已经成了 DeepSeek 的标配。百万级上下文意味着你可以把一整本技术文档、一个中型代码仓库、甚至几十轮的复杂对话历史一次性塞进去,模型不会「失忆」。

对开发者来说,这直接影响了 RAG 架构的设计选择——当上下文窗口足够大,很多原本需要精心设计检索策略的场景,可以简化为「全塞进去让模型自己找」。当然,这不是说 RAG 没用了,而是工程复杂度的下限被大幅拉低了。

DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 模型能力对比图


定价:Flash 低至 1 元/百万 Tokens,Pro 呢?

先看 Flash 的价格:

计费项 价格
输入(缓存命中) 1 元 / 百万 Tokens
输出 2 元 / 百万 Tokens

这个价格已经卷到了一个让人麻木的程度。做个简单换算:一百万 Tokens 大约相当于 75 万个汉字,差不多是两本《三体》的篇幅。输入成本 1 块钱。

阿里云百炼强调的是「与 DeepSeek 官网完全一致」。这句话的潜台词是:我不赚模型差价,我赚的是平台生态的钱

这跟传统云厂商代售第三方模型的逻辑不一样。过去,云平台接入第三方模型通常会加一层利润,哪怕只是几个百分点。阿里云百炼选择平价接入,本质上是在用 DeepSeek 的流量来养自己的平台生态——用户来了,可能顺便用上百炼的微调、知识库、向量检索、应用编排等一系列增值服务。模型本身不赚钱,但围绕模型的工具链和服务是利润来源。

这个策略其实跟超市里的「引流品」逻辑一模一样。


百炼的「模型超市」策略:100+ 模型背后的平台野心

截至目前,阿里云百炼已经上线了 100 多款全模态模型。这个数字本身就说明了百炼的定位——它不想只做「通义千问的家」,而是要做所有主流模型的集散地。

从平台已有的模型矩阵来看:

  • 自家模型:通义千问系列(Qwen)覆盖文本、图像、语音、视频
  • DeepSeek 系列:从早期的 V3、R1 到现在的 V4,一路跟进
  • 其他第三方模型:通过快手万擎等渠道接入的各类模型

百炼的差异化在于它不只是一个 API 转发层。它提供的是一整套开发工具链:

  1. 模型调用:统一的 API 接口,兼容 OpenAI 格式
  2. 模型微调:支持在平台上直接对模型进行 SFT
  3. 知识库管理:内置向量检索,支持 RAG 应用的快速搭建
  4. 应用编排:智能体(Agent)构建、MCP 服务集成
  5. 多渠道发布:一键发布到钉钉、网页等终端

对于企业开发者来说,这意味着不用自己搭基础设施,也不用在多个模型厂商之间来回切换 API Key。在一个平台上完成从模型选型到应用上线的全流程。

当然,这种「一站式」的便利性是有代价的——你的数据、工作流、应用架构都会逐渐绑定在百炼的生态里。这是所有平台型产品的共同策略,也是开发者需要权衡的。


跟其他平台比,百炼的接入速度说明了什么

值得注意的是,阿里云百炼用的是「首发」这个词。同一天,华为云也宣布了对 DeepSeek-V4 的适配。两家云厂商几乎是在 DeepSeek-V4 发布的同一天就完成了接入。

这背后有两层信息:

第一,云厂商对 DeepSeek 的重视程度已经到了「Day 0 适配」的级别。 这在以前是不可想象的。一个国产开源模型,能让阿里云和华为云在发布当天就抢着上线,说明 DeepSeek 在开发者群体中的号召力已经足够强。云厂商不是在做慈善,它们是在抢用户。

第二,模型接入的技术门槛在快速降低。 DeepSeek-V4 能在发布当天就被多个平台适配,一方面是因为 DeepSeek 的模型架构和 API 设计越来越标准化,另一方面也是因为云平台的模型接入流水线已经非常成熟。从拿到模型权重到完成部署、调通 API、上线服务,整个流程可能只需要几个小时。

这种「Day 0 适配」的竞争态势,对开发者来说是好事——你几乎不需要等待,模型一发布就能在自己熟悉的平台上用起来。


百炼 Token Plan:即将支持 DeepSeek-V4

36 氪的报道中提到一个细节:百炼 Token Plan 近期也将支持调用 DeepSeek-V4 模型

百炼 Token Plan 是阿里云推出的预付费 Token 包方案,类似于手机话费套餐——预充值一定金额,按量抵扣,通常会比按量付费便宜一些。如果你的业务有稳定的调用量,Token Plan 能进一步压低单位成本。

目前 Token Plan 还没有正式支持 V4,但「近期支持」这个表态说明阿里云已经在走流程了。对于大批量调用 DeepSeek-V4 的企业用户来说,这是一个值得关注的成本优化选项。


开发者视角:百炼上调用 DeepSeek-V4 的实际体验

从技术实现来看,百炼对 DeepSeek 系列的接入方式是通过 OpenAI 兼容接口。这意味着如果你已经在用 OpenAI SDK 或者任何兼容 OpenAI 格式的客户端,切换到百炼上的 DeepSeek-V4 几乎是零成本的——改一下 base_urlmodel 名称就行。

从百炼已有的 DeepSeek 接入经验来看(比如此前的 V3.2-think 模型),调用方式大致如下:

from openai import OpenAI

client = OpenAI(
    api_key="your-dashscope-api-key",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",  # 或 deepseek-v4-flash
    messages=[
        {"role": "user", "content": "你的问题"}
    ],
    stream=True
)

for chunk in response:
    delta = chunk.choices[0].delta
    if delta.content:
        print(delta.content, end="", flush=True)

注意:以上代码基于百炼已有的 DeepSeek 接入模式推断,实际的模型 ID 和参数请以阿里云百炼官方文档为准。V4 系列是否支持思考模式(thinking mode)等高级功能,也需要等官方文档更新后确认。

百炼的 OpenAI 兼容模式意味着你可以直接用 openai Python 包、Node.js SDK,甚至 curl 来调用。不需要安装额外的 SDK,不需要学习新的 API 格式。这对于已经有 OpenAI 生态工具链的团队来说,迁移成本几乎为零。


更大的图景:模型分发正在成为新战场

把视角拉远一点,阿里云百炼首发接入 DeepSeek-V4 这件事,折射出的是 AI 行业的一个结构性变化:模型分发正在成为独立于模型研发之外的新战场

过去两年,行业的焦点在模型本身——谁的参数多、谁的 benchmark 高、谁的推理能力强。但随着开源模型的能力逼近甚至超越部分闭源模型,「模型在哪里用」变得和「模型本身好不好」一样重要。

目前,模型分发的玩家大致分为几类:

类型 代表 特点
云厂商平台 阿里云百炼、华为云 ModelArts 重资产,提供完整工具链
API 聚合平台 OpenAI Hub 等 轻量级,一个 Key 调多模型
模型厂商自营 DeepSeek 官网 直连,但功能单一
开源自部署 本地 / 私有云部署 完全可控,但运维成本高

每种方式都有自己的适用场景。百炼的优势在于它背靠阿里云的基础设施,能提供从模型调用到应用部署的完整链路。但对于只需要快速调用 API、不想被单一云厂商绑定的开发者来说,轻量级的 API 聚合方案可能更合适。

比如 OpenAI Hub 这类聚合平台,一个 API Key 就能调用 GPT、Claude、Gemini、DeepSeek 等主流模型,国内直连,兼容 OpenAI 格式。它解决的是「我想快速试用和切换不同模型」这个需求,而不是「我要在一个平台上完成所有开发工作」。

两种模式不矛盾,甚至可以互补。关键是看你的需求在哪个层面。


一个值得思考的问题:平价接入能持续多久?

阿里云百炼承诺 DeepSeek-V4 的 API 定价与官网一致。但这个「一致」能维持多久,取决于几个因素:

  1. DeepSeek 自身的定价策略:如果 DeepSeek 未来调价,百炼是否跟进?
  2. 算力成本:百炼需要自己部署推理集群来服务这些请求,算力成本不是零
  3. 竞争格局:如果华为云、腾讯云也平价接入,百炼就不太可能单方面涨价

目前来看,DeepSeek-V4 Flash 的 1 元/百万 Tokens 输入价格,已经低到了一个让大多数开发者不需要纠结成本的水平。在这个价格下,模型调用成本在整个应用的运营成本中几乎可以忽略不计。真正花钱的地方是开发人力、用户获取和运维。

这也是为什么云厂商愿意平价甚至补贴来做模型分发——模型调用本身的收入不是重点,重要的是把开发者留在自己的生态里,然后通过计算、存储、网络等基础设施服务来变现。


对开发者的实际建议

如果你正在考虑使用 DeepSeek-V4,以下几点可能有用:

  1. 选 Pro 还是 Flash? 如果你的场景涉及复杂推理、多步骤规划、代码生成等高难度任务,选 Pro。如果是客服对话、内容生成、简单问答等标准场景,Flash 的性价比更高。

  2. 要不要通过百炼来调用? 如果你已经在用阿里云的其他服务(ECS、OSS、RDS 等),百炼是自然的选择,可以减少跨平台的复杂度。如果你的技术栈不在阿里云生态内,直接用 DeepSeek 官网 API 或者 API 聚合平台可能更简单。

  3. 百万上下文怎么用? 不要因为窗口大就无脑塞内容。Token 是按量计费的,100 万 Tokens 的输入即使只要 1 块钱,如果每个请求都塞满,高并发下成本也会快速累积。合理设计 prompt,该用 RAG 检索的还是要用。

  4. 关注 Token Plan:如果你的调用量稳定且可预测,等百炼的 Token Plan 支持 V4 后,可以考虑预付费方案来进一步降低成本。


写在最后

阿里云百炼首发接入 DeepSeek-V4,这件事本身不意外——云厂商抢着上线热门模型已经是常规操作了。真正值得关注的是两个趋势:

一是 模型分发的竞争正在从「有没有」变成「好不好用」。光是把模型 API 挂上去已经不够了,平台需要在工具链、开发体验、成本优化上做出差异化。百炼的知识库、Agent 编排、MCP 服务集成、钉钉发布等功能,就是在这个方向上的尝试。

二是 开源模型的生态正在快速成熟。DeepSeek-V4 发布当天就有多个平台完成适配,寒武纪等芯片厂商也在 Day 0 完成了硬件适配。这种生态响应速度,说明围绕开源模型的产业链已经相当完善。

对开发者来说,这是最好的时代——模型越来越强,价格越来越低,可选的平台和工具越来越多。唯一的挑战可能是选择太多了。

但这总比没得选好。


参考来源