呼和浩特上线全国首个绿色算力全栈AI平台,十余款主流模型一站式接入

行业快讯

5月30日,全国首个绿色算力全栈AI平台在呼和浩特正式上线,集成算力调度、模型调用、词元结算全链条服务,首批接入十余款主流模型,填补区域词元交易服务空白。

呼和浩特上线全国首个绿色算力全栈AI平台,十余款主流模型一站式接入

5 月 30 日,全国首个绿色算力全栈 AI 平台——内蒙古词元交易平台在呼和浩特正式上线。这事看起来像又一个地方算力中心揭牌,但仔细看条目,路数其实和过去几年常见的「数据中心 + 政策口号」不太一样:它直接把 Token 交易摆到了台面上,做的不是机房生意,是 AI 服务的二级市场。

平台由内蒙古大数据产业发展集团、内蒙古数据交易中心、内蒙古算网科技三方联合共建,定位「中国云谷」的核心创新成果,落地在内蒙古自贸试验区呼和浩特片区。同一天,工信部印发《算力互联互通行动计划》——两件事撞在一个日历上,并非巧合。

呼和浩特绿色算力全栈AI平台上线现场

把 Token 当电卖,这事到底新在哪

过去几年,国内做算力的逻辑基本是「建机房、上卡、卖租赁」,本质是 IaaS 的延伸。而这次呼和浩特上线的这个平台,把链条往上拽了两层:

  • 底层:聚合全国节点的通算、智算、超算等异构算力资源,适配国产芯片与主流算力架构
  • 中间层:首批接入三大运营商和头部厂商的十余款主流模型
  • 上层:直接做 Token 的交易结算

按官方表述,构建的是「算力输出 — 模型调用 — 应用落地 — 词元结算」的全链路。这套话术翻译成开发者听得懂的语言:你不再需要分别去三大运营商谈算力合同、找模型厂商签 API、再自己搭一套计费系统,而是在一个平台里完成「下单—调用—结算」的全部动作。

这个思路其实和云厂商的 Model-as-a-Service、以及海外 OpenRouter、国内若干模型聚合平台的路子大方向一致——用一个统一入口、一套计费体系,把碎片化的模型供给整合起来。区别在于,这次牵头的是地方政府背景的混合主体,而且明确把「绿色算力」和「合规化 Token 交易」作为标签。

「绿色」二字不是装饰

选址呼和浩特并不意外。内蒙古的电价、气候、土地成本,是全国跑大规模训练和推理最划算的地区之一。中国移动、中国电信、阿里、字节的大型算力基地都在向这一带集中。所谓「中国云谷」的提法,就是把这一区位优势制度化的产物。

「绿色算力」在这里有两层含义:

  1. 物理层面:风电、光伏等清洁能源供电,PUE 控制在低位
  2. 结算层面:未来很可能与碳排放披露、绿电溯源挂钩,给政企客户提供可审计的「低碳 AI 调用」凭证

第二层是更值得开发者关注的。当 AI 调用进入 ESG 报告口径,「这次推理用的是哪片绿电、对应多少碳足迹」就不再是营销话术,而是实打实的合规需求。一个能在结算层把碳数据带出来的平台,对走政府、金融、央国企渠道的应用厂商来说,价值不小。

适配国产芯片,但别期待太多细节

通稿里反复强调「全面适配国产芯片与主流算力架构」。具体哪些芯片,没说。基于现在的产业格局可以合理推测:华为昇腾系列大概率在内,海光、寒武纪、沐曦、燧原也都是候选。再加上 NVIDIA 存量算力,构成一个异构资源池。

做异构调度,最难的不是调度算法本身,而是模型在不同芯片上的适配、量化精度、性能差异如何对用户屏蔽。同一个 Qwen-72B,跑在 H100 和昇腾 910B 上,吞吐、延迟、价格都不一样。如果平台只提供一个统一的 API 入口,用户怎么知道自己请求落在哪片卡上、SLA 怎么保障——这些细节,目前还没有公开披露。

大概率的路径是:

  • 标准化的模型(如 DeepSeek、Qwen、GLM 系列)做多后端适配
  • 调度策略按价格 / 延迟 / 合规偏好做路由
  • 用户侧通过 OpenAI 兼容协议接入

这套模式国内外都有先例,难点在工程,不在理论。

十余款主流模型是哪些

通稿没有给出完整清单,但「三大通信运营商 + 头部科技厂商」基本框定了范围:

供给方 可能接入的模型
中国移动 九天系列
中国电信 TeleChat 系列
中国联通 元景系列
头部科技厂商 通义、文心、混元、豆包、DeepSeek、智谱 GLM 等

如果以上推测大致成立,那么「十余款」覆盖的将是国内通用大模型的主力阵容。对 to B 客户来说,一份合同跑通所有国产主流模型,这件事的意义比单个模型多强一档要大得多——招标流程、数据合规审查、发票结算这些非技术摩擦,往往才是政企采购的真正瓶颈。

「Token 券」「算力券」:补贴换生态

通稿里有个容易被忽略的细节:平台下一步将通过「Token 券」「算力券」吸引模型厂商、算力企业、数据服务商入驻。

这套打法熟悉互联网的人一眼就懂——补贴换 GMV、换生态密度。把它放在算力语境下,等于是用财政或产业资金做冷启动,先把开发者和应用厂商引进来,跑出几个有规模的案例,再形成正向循环。

这种模式能不能跑通,关键看两点:

  • 价格能不能真的便宜。如果券后单价比阿里云百炼、火山引擎方舟便宜一截,自然有开发者愿意切
  • 稳定性能不能跟上。Token 服务最怕的不是贵,是抖动——P99 延迟一旦不可控,再便宜也没用

放在更大的图景里看

5 月 30 日同一天,工信部印发《算力互联互通行动计划》,目标是:

  • 2026 年:建立较为完备的算力互联互通标准、标识和规则体系
  • 2028 年:基本实现全国公共算力标准化互联,形成「具备智能感知、实时发现、随需获取」的算力互联网

配合此前已经发布的 12 项算力监测调度、算电协同、安全保护相关指导性技术文件,国家层面正在把「算力像电网一样统一调配」这件事,从口号推到标准。

呼和浩特这个平台,本质是这套标准体系的一个落地试点——往上要对接全国一体化算力网,往下要把异构算力和模型供给整合成可交易的 Token。它走通了,可能就是后面各省复制的模板;走不通,也至少把哪些环节是真坑、哪些是伪需求摸清楚了

对开发者意味着什么

短期看,对个人开发者影响不大。这类平台首批客户必然是政府、央企、科研机构,付费门槛、对接流程都偏 B 端。

中期看,有两个值得跟踪的信号:

  1. 价格信号:如果通过补贴把主流模型的 Token 单价压到一个新的低点,会反向倒逼商业云厂商调价
  2. 合规信号:如果「绿电凭证 + 数据出境合规 + 国产芯片调用记录」能在一个平台里集齐,那么任何需要做合规 AI 应用的厂商,都会重新评估自己的技术栈选择

模型聚合这条路本身已经被验证过——海外 OpenRouter、国内多家聚合服务(包括我们 OpenAI Hub 在内的几家平台)都在用「一个 Key 调所有模型、兼容 OpenAI 协议」这套抽象在解决同一个问题。差别在于,绿色算力全栈 AI 平台带着「国家队 + 地方政府 + 绿色算力」的标签,做的是 to G/B 主战场。两类平台未来更可能是并存而非替代:开发者和创业团队继续要灵活、低延迟、海内外模型混用的聚合服务,政企客户走合规、绿色、国产化优先的官方通道。

还有几个待解的问题

通稿没回答,但开发者迟早要问:

  • 协议层:是否完全兼容 OpenAI API?流式、function calling、多模态怎么支持?
  • SLA:异构算力池下,单次请求的延迟和可用性怎么承诺?
  • 数据合规:模型调用日志的留存策略、跨域数据流转规则是什么?
  • 结算粒度:Token 计价是否按各模型原生 tokenizer 计算,还是统一折算?这直接影响成本核算
  • 生态开放度:第三方模型厂商接入的门槛和分成模式如何

这些问题,可能要等到平台开放更详细的开发者文档才会有答案。

写在最后

回到开头那句话——这事新在哪。新的不是「又上线一个 AI 平台」,而是国家层面第一次把「算力 + 模型 + Token 结算」这三件事,用一个带政府背书的全栈平台串起来,并且明确写在了同一天发布的国家级行动计划里。

从机房到 Token,从硬件到 API,从「电网比喻」到真的能开发票结算 Token——这条链路打通的那一刻,国内 AI 基础设施才算真的走完了从「卖卡」到「卖服务」的转身。呼和浩特只是起点,接下来值得关注的,是这套模板会以多快的速度,在长三角、珠三角、成渝几个算力高地复制开来。

参考来源