阿里云 QoderWork 首推「峰谷 Token」,夜间调用 Qwen3.7 低至 2 折
6 月 23 日晚,阿里云 QoderWork 正式上线国内首个 Agent「峰谷 Token」机制,每晚 22:00 至次日 08:00 调用大模型可享自动折扣,Qwen3.7-Max 低至 2 折,覆盖 QoderWork、QoderDesktop、CLI 等全系产品。
阿里云 QoderWork 首推「峰谷 Token」,夜间调用 Qwen3.7 低至 2 折
国内首个 Agent 产品「峰谷计费」机制落地:把电力市场的削峰填谷逻辑搬进了 AI Token 世界。
6 月 24 日消息,就在昨晚(6 月 23 日),阿里云旗下桌面 AI 智能体平台 QoderWork 正式宣布上线「峰谷 Token」计费机制。根据公告,Agent 在每日 22:00 至次日 08:00 运行可自动享受夜间折扣,其中明星模型 Qwen3.7-Max 低至 2 折,整体积分消耗仅为白天的 20%-40%。
这是国内 Agent 赛道首次出现「分时计费」机制——QoderWork 把电力行业耳熟能详的「峰谷电价」逻辑搬到了大模型调用层面,瞄准的是 Agent 时代日益突出的「算力错峰利用」难题。
一、机制详解:22:00 到 08:00,自动 2-4 折
根据阿里云官方公告,峰谷 Token 的核心规则极为简单——无需用户手动切换、无需申请额度、无需提交工单,只要 Agent 任务的执行时段落在每晚 22:00 至次日早 8:00 之间,系统会自动按夜间折扣计算积分消耗。
具体折扣力度方面:
- Qwen3.7-Max:低至 2 折(即 20% 积分消耗)
- 其他主力模型:整体落在 2-4 折 区间
- 覆盖范围:QoderWork、QoderDesktop、Qoder CLI 全系产品
- 触发方式:自动识别任务运行时段,无需任何额外操作
值得注意的是,这里的「夜间」判定以 Agent 实际执行时段 为准,而非提交时间。也就是说,用户可以在白天的工作时间正常编写指令、调试 Prompt,然后通过定时任务或长程任务(long-horizon task)的方式,把真正消耗 Token 的繁重计算环节推到夜里。
官方给出的典型用法是:
白天设好定时任务,或者睡前提交长程任务指令,由 Agent 在夜间自主执行完整流程,早上起来验收即可。
这一套「白天编排、夜间执行、清晨验收」的工作流,正好契合了 Agent 产品「异步、长程、自治」的本质特征。
二、为什么是「峰谷 Token」?
要理解这次机制创新的意义,需要回到一个朴素的问题:大模型推理的成本结构到底长什么样?
业内众所周知,大模型推理服务背后是一片片成本高昂的 GPU 集群。这些集群的 峰值产能是按日间高峰准备的——白天 9 点到 22 点,开发者、白领、学生用户密集调用,云厂商不得不预留充足的 GPU 余量来保证 SLA。而到了深夜,调用量往往断崖式下跌,大量 GPU 处于半空闲状态,但电费、折旧、运维成本一刻不停。
这种「白天紧、夜里松」的供需错配,本质上和电力行业的「峰谷负荷曲线」一模一样。电力行业的应对方式是「峰谷电价」——用价格信号引导用户在用电低谷时段消费。如今阿里云把这一逻辑映射到 Token 层面:
- 白天:GPU 紧俏,全价计费
- 夜间:GPU 闲置,2-4 折让利
- 结果:云厂商提升集群利用率,用户拿到实打实的折扣
这是一种双赢的削峰填谷。在 Agent 调用量正在快速「指数化」的当下,谁能率先把闲置算力变现,谁就能在价格战中占据成本优势。
三、Agent 时代,为什么「夜间执行」特别合理?
传统的 IDE 编程助手(如代码补全类工具)有一个鲜明特征——用户必须在线。补全是同步操作,离开了人类的实时反馈,工具就没意义。
但 Agent 工具不一样。QoderWork 这类桌面智能体的核心使用场景,已经从「秒级响应」迁移到「长程任务」:
- 让 Agent 整理一周的会议纪要并输出周报
- 让 Agent 通宵调研某个技术方案,给出对比分析
- 让 Agent 批量处理几百份 PDF,提取结构化数据
- 让 Agent 自主编写、运行、调试一个完整的小项目
- 让 Agent 跟进多个数据看板,凌晨生成日报
这些任务的共性是:用户并不需要实时盯着屏幕。提交一句自然语言指令后,Agent 会自己拆解步骤、调用工具、操作本地应用、生成中间产物。任务跑 1 小时、跑 8 小时,对用户体验差别不大——只要早上能拿到结果就行。
这正是「峰谷 Token」存在的产品逻辑基础:Agent 任务天然具备「时间不敏感」的特性,可以被无损地搬运到夜间执行。这一点,是 Chatbot 或代码补全这种同步交互形态永远无法享有的红利。
四、典型使用场景:把 Agent 当「夜班同事」用
结合 QoderWork 的产品能力,「峰谷 Token」机制催生了几种很有想象力的使用范式:
1. 定时任务流
白天在 QoderWork 工作台中编排好一条复杂的多步任务流(比如「拉取数据库 → 生成图表 → 起草分析报告 → 发送邮件」),设定执行时间为 23:00,第二天早上来公司直接看产物。
2. 长程编码任务
通过 Qoder CLI 提交一个大型重构任务,比如「把仓库里所有 JS 文件迁移到 TypeScript,并补齐单元测试」。睡前一句话,早上看 PR 草稿。
3. 批量数据处理
夜间集中跑数据清洗、特征提取、向量化入库等重型 batch 任务。同样的 Token 预算,能多跑 3-5 倍的量。
4. 数字员工值夜班
QoderWork 产品家族里的「QoderWake 数字员工」也可享受夜间折扣。一个数字员工 7×24 持续运行,原本是不菲的成本,现在夜间 16 小时窗口的成本只占白天的两三成,整体 TCO(总拥有成本)显著下降。
五、QoderWork 是什么?回顾这条产品线
对部分用户来说,QoderWork 这个名字可能还有些陌生。这里做个简单回顾。
QoderWork 是阿里巴巴在 2026 年 1 月 推出的桌面 AI 智能体工具——用户通过自然语言指令,就可以让 AI 直接操作电脑上的本地应用和文件,完成文档生成、数据分析、文件整理等任务,目前同时支持 Mac 与 Windows 双平台。
截至目前,Qoder 产品家族已扩展为一个相当庞大的矩阵:
- Qoder Desktop:桌面端 IDE 形态
- Qoder CLI:命令行 Agent
- Qoder JetBrains 插件:面向 JetBrains 全家桶的 IDE 扩展
- QoderWork:桌面智能体工作台
- QoderWake:数字员工
- Cloud Agents:云端 Agent
- Qoder 移动端:手机 App
据官方披露,全系产品已推出中国版,累计服务全球超过 500 万用户。在能力建设上,QoderWork 此前已上线 Design Desk(设计工作台)、写作工作台,以及面向产品、法务、市场营销等行业的专家套件,并推出了具备记忆、反思、技能进化功能的「意识」系统,用于提升 Agent 的自主性和效率。
这一次的「峰谷 Token」,更像是在「能力侧」竞争白热化之后,QoderWork 在「计费侧」打出的差异化牌——它不是单纯地降价,而是借助 Agent 异步执行的产品特性,把降价与场景深度绑定。
六、行业影响:Agent 计费会不会全面「分时化」?
阿里云这一步,可能会引发整个 Agent 行业的连锁反应。
首先,QoderWork 自称这是国内首个上线「峰谷 Token」的 Agent 产品。考虑到 Agent 赛道目前几乎所有主流玩家(无论是国内还是海外)都在面临单位调用成本居高不下的难题,分时计费几乎是一个必然会被广泛模仿的方向。
其次,「峰谷 Token」会反过来塑造用户的使用习惯。一旦用户养成「夜间提交长任务」的肌肉记忆,Agent 产品形态本身也会朝着「更适合异步、更适合长程、更适合自动化编排」的方向演化——这与 Anthropic 等海外厂商近期反复强调的「long-horizon agents」趋势完全合拍。
再次,这种机制也对 GPU 集群调度技术 提出了更高要求。云厂商需要更精细的负载预测和弹性伸缩能力,才能把「夜间任务」精准消化在原本闲置的产能里,而不至于在所有用户都涌入夜间窗口时再次造成新的峰值拥堵。
最后,从商业模式的角度看,「峰谷 Token」还有一层隐含意义——它鼓励用户从「Chat 模式」迁移到「Agent 模式」。Chat 是即时对话,无法享受夜间折扣;Agent 是异步执行,可以无缝吃到 2 折。计费层面的这道杠杆,会持续推动用户从「问一句答一句」的轻量交互,走向「下一个指令,Agent 跑一晚」的重度自治。
七、几点提醒与小贴士
如果你已经是 QoderWork 用户,准备体验「峰谷 Token」,有几个细节值得留意:
- 判定时段以执行时间为准:提交时间在白天没关系,关键是任务真正消耗 Token 的时段是否落在 22:00-08:00 区间。
- 跨时段任务如何计费:官方暂未详细说明跨越「峰谷分界点」的任务如何按段计费,建议复杂任务尽量整段安排在低谷窗口。
- Qwen3.7-Max 是最大受益者:2 折是当前披露的最高折扣,其余模型在 2-4 折区间,可以按任务复杂度选择最经济的组合。
- 善用定时任务:把白天的「即时需求」拆分成「编排 + 异步执行」两段,是最大化享受夜间折扣的核心姿势。
- 关注「意识」系统的演进:长程任务对 Agent 的记忆、反思、错误恢复能力提出了更高要求,目前 QoderWork 自研的「意识」系统是夜间长程任务能否稳定跑完的关键保障。
八、写在最后
大模型行业经历过 2023-2025 年的「参数竞赛」「推理优化竞赛」之后,进入 2026 年,竞争的焦点正在快速向应用层和商业模式层迁移。Agent 是当下最重要的应用形态,而围绕 Agent 的计费创新,注定会成为接下来一年云厂商比拼的新战场。
阿里云 QoderWork 这次的「峰谷 Token」机制,看似只是一次「夜间打折促销」,但本质上是把 Agent 异步执行的产品特性、GPU 集群削峰填谷的工程现实、以及用户对降本的迫切需求这三件事,巧妙地缝合在了一起。它不是简单降价——它是在用价格信号,重新塑造 Agent 时代的使用范式。
至于 2 折是否会成为业界新标杆,又会不会引来腾讯云、火山引擎、百度智能云等厂商的跟进,我们不妨拭目以待。
参考来源
- 阿里云:QoderWork 推出「峰谷 Token」,错峰使用 Qwen 3.7 低至 2 折 - IT之家:IT之家关于 QoderWork 峰谷 Token 机制上线的首发报道,含官方公告核心要点。
- 智能时代频道 - IT之家:IT之家智能时代频道,持续跟踪国内 AI 工具及 Agent 产品的最新动态。



