腾讯取消 Token 排名内卷,按产出动态分配额度

产品更新

腾讯内部宣布调整 AI Token 配额机制,从全员统一额度改为按工作任务动态调配,不搞消耗量排名,只看实际产出价值。这标志着企业 AI 资源管理从粗放式分配走向精细化按需供给。

腾讯取消 Token 排名内卷,按产出动态分配额度

腾讯今天在内部宣布调整 AI Token 配额机制。核心变化是:全员统一额度改为按工作任务动态调配,不再按消耗量排名,只看实际产出。

这个调整来得正是时候。过去几个月,国内大厂内部普遍出现了一种新型内卷——员工为了证明自己在用 AI,疯狂刷 Token 消耗量。有人把代码反复喂给模型重构,有人让 AI 生成大量无用文档,目的只有一个:让自己的 Token 消耗数据好看一点。

腾讯这次直接把游戏规则改了。通知明确表态:总投入只增不减,对能用 AI 带来显著提效和价值产出的员工,保障 Token 额度。关键是后面这句——不搞 Token 消耗量排名,不贩卖焦虑

腾讯内部 AI Token 配额调整通知示意图

从人均分配到按需供给

初期的 Token 分配逻辑很简单:每人每月固定额度,用完就等下个月。这种做法在 AI 工具刚落地时问题不大,但随着实际使用场景分化,矛盾开始显现。

写文档的产品经理可能一个月用不完 10 万 Token,而做代码生成的后端工程师可能两天就把 50 万额度跑完。前者的额度闲置浪费,后者被迫降低工作效率。更糟糕的是,当 HR 开始统计各部门的 Token 使用率,员工为了证明自己"在用 AI",开始刷无效消耗。

腾讯这次调整的底层逻辑是:Token 不是福利,是生产资料。生产资料的分配应该跟着产出走,而不是按人头平均。

一位腾讯员工的案例很能说明问题。这位工程师用 AI 辅助编码,跑出来的代码量是同事的 3 倍。按旧机制,他的高消耗可能被质疑"是不是在浪费 Token"。新机制下,他的老板主动给他增加了配额——因为产出摆在那里,多给资源是值得的。

技术优化配合管理升级

调整配额机制的同时,腾讯也在技术层面做了配套优化。官方披露的数据显示,通过上线上下文缓存、高频请求复用、外置记忆优化等机制,最高可减少超过 61% 的 Token 消耗

这些优化手段并不新鲜,但能落地到这个程度的不多。上下文缓存针对的是重复对话场景——如果用户连续几轮对话都在讨论同一个代码文件,系统会把文件内容缓存起来,后续请求只传增量部分。高频请求复用则是识别出团队内常见的代码模板、文档框架等,直接调用缓存结果,不走完整的模型推理。

外置记忆是个更底层的优化。传统的 AI 对话把所有上下文都塞进 prompt,导致 Token 消耗随对话轮次线性增长。外置记忆把不常变化的背景信息(项目文档、代码规范、历史决策)存到向量数据库,需要时再检索注入,避免每次都重复传输。

这套组合拳下来,同样的工作任务,Token 消耗可以降到原来的三分之一甚至更低。这为按需分配提供了技术基础——总投入增加的同时,单位产出的成本在下降。

Token 成为企业 AI 时代的新工时

腾讯的调整背后,是 Token 这个技术单位正在演变成经济单位的过程。

在 ChatGPT 刚出来那会儿,Token 只是开发者关心的计费单位。现在它开始具备"数字工时"的属性——衡量的不再是算力消耗,而是智能劳动的投入量。一个需求从理解到实现,涉及多少轮模型推理、调用了哪些工具、生成了多少代码,最终都会折算成 Token 消耗。

这个变化在腾讯云今年 3 月发布的 Token Hub 上体现得很明显。他们把 MaaS 平台升级成了 Token Hub,核心逻辑从"提供模型调用能力"变成"按任务执行分配资源"。企业客户不再是买多少 API 调用次数,而是买多少 Token 额度,系统根据任务复杂度自动调度模型、工具、记忆等资源。

腾讯高管在公开场合透露,今年腾讯大部分代码都是由 AI 生成。工程师的工作重心转向架构设计和代码审查,具体实现交给 AI。这种工作模式下,Token 消耗直接对应产出——写得多、改得多,消耗自然高;但如果产出的代码质量好、迭代少,总体成本反而更低。

行业层面的信号

腾讯这次调整释放的信号,不只是内部管理优化,更是整个行业从 AI 工具化走向 AI 生产化的标志。

早期大家把 AI 当工具,关注的是"能不能用"。现在进入规模化应用阶段,核心问题变成了"怎么用得好"。用得好不是指每个人都把额度用满,而是让真正能产生价值的场景获得足够资源,同时避免无效消耗。

IDC 的数据显示,中国企业智能体的 Token 消耗年均增长超过 30 倍。这个增速背后,既有业务规模扩大的因素,也有大量试错和浪费。当 Token 变成可计量的成本中心,企业必然会开始精细化管理。

腾讯的做法提供了一个参考范式:不是限制使用,而是优化分配。总投入持续增加,但资源流向更聚焦——向真正产生价值的场景倾斜,而不是按人头或部门平摊。

这种管理思路的转变,本质上是在回答一个问题:AI 时代的生产力该如何评估?过去看工作时长、代码行数、文档篇数,现在这些指标都不够准。当 AI 可以快速生成大量内容,评估标准必须上升到"产出的价值"这个层面。Token 消耗只是过程指标,最终交付的成果才是目标。

从内卷到提效

取消 Token 排名这个动作,看起来只是去掉了一个考核维度,实际上是在重新定义 AI 工具的使用文化。

当你知道公司会统计并排名 Token 消耗量,你的使用行为就会扭曲。你会倾向于做那些消耗大但未必有用的事情,因为数据好看。你会避免那些真正需要深度思考、多次迭代但单次消耗不高的工作,因为"不划算"。

去掉排名之后,员工的注意力可以回到工作本身。你不需要向数据证明自己在用 AI,只需要向结果证明 AI 帮你提升了效率。老板给你加额度的依据,不是你上个月用了多少,而是你这个月能产出什么。

这种转变对管理层的要求更高。以前看 Token 消耗排名就能量化"AI 使用情况",现在得真正评估每个人的产出质量。但这才是正确的方向——数字化不是为了让管理更简单,而是为了让管理更精准。

腾讯内部有个说法,每月最好能消耗 1000 元的 Token。这个数字本身不重要,重要的是背后的预期:公司希望员工深度使用 AI 工具,而不是浅尝辄止。但"深度使用"的标准从消耗量变成了产出价值,这是本质区别。

技术债与组织债

企业上 AI 容易,用好 AI 难。技术层面的集成和部署只是第一步,真正的挑战在组织和文化层面。

很多公司给员工开通了 AI 工具,但没有配套的培训、没有明确的使用场景、没有合理的激励机制。结果就是工具闲置,或者被用错方向。有的团队为了完成"AI 应用率"指标,把原本不需要 AI 的流程硬套上 AI,反而降低了效率。

腾讯这次调整,实际上是在偿还这笔"组织债"。承认初期的平均分配不合理,承认用消耗量考核会带来内卷,然后用更科学的机制替代。这个过程需要技术支撑(缓存、复用、动态调度),也需要管理层转变思维(从管控到赋能)。

从更大的时间尺度看,这是企业从"拥有 AI 工具"到"建立 AI 生产方式"的必经阶段。工具是外在的,生产方式是内化的。当 AI 真正融入日常工作流程,Token 的分配和使用就不再需要专门管理,它会像用电量一样成为自然发生的结果——你用了多少,取决于你做了多少事。

写在最后

腾讯这次调整的价值,不在于具体的额度数字或技术优化,而在于它明确传递了一个信号:AI 资源管理的正确姿势,是向产出要效率,而不是向消耗要数据

这个逻辑说起来简单,但真正落地需要技术、管理、文化的系统性配合。技术上要能做到精细化计量和动态调度,管理上要能评估真实产出而不是表面数据,文化上要鼓励高效使用而不是盲目消耗。

对其他企业来说,腾讯的经验提供了一个参考:不要急着上 AI,更不要用传统的 KPI 思维管理 AI。先想清楚 AI 要解决什么问题,再设计相应的资源分配和评估机制。如果只是为了"显得很 AI",那还不如不上。

Token 已经从技术概念变成了生产要素。如何分配、如何使用、如何评估,这些问题的答案,将决定企业在 AI 时代的真实竞争力。


参考来源