海光把抗量子密码塞进了芯片,金融场景实测跑到3万TPS

6月16日,海光信息在上海国际金融展上端出"可信智能体引擎"和面向金融的抗量子密码方案,CPU+DCU双芯做底,单方案实测最高撑到30000 TPS,已经在银行、保险、券商落地。
海光把抗量子密码塞进了芯片,金融场景实测跑到3万TPS
6月16日,海光信息在上海国际金融展上甩出了两张牌:一张是面向大模型训练与智能体推理的"可信智能体引擎",另一张是给金融行业准备的抗量子密码方案。两套东西的共同特征只有一个——安全能力不再外挂,而是直接刻进了 CPU 和 DCU 里。
按官方给出的数据,这套抗量子密码方案在金融场景下实测可以支撑 10000 到 30000 TPS 的高并发处理。这个数字摆在桌面上,意味着它已经不是 PoC 阶段的玩具,而是能直接进生产的工业级方案。目前海光给出的客户名单里,银行、保险、资本市场都有,落地节奏比想象中要快。
可信智能体引擎:把 Token 上下文全程加密
先说"可信智能体引擎"这个产品名,听上去像个概念,但拆开看其实指向了一个非常具体的痛点:大模型推理过程中,Token 上下文数据是明文还是密文?
过去做企业级 AI 部署的同行应该都遇到过这个尴尬——模型在云端跑,Prompt 里的合同条款、客户信息、交易策略全都得明文喂进去。即便链路加密做得再漂亮,到了 GPU 显存里依然是裸奔状态。运维人员、平台方、底层云厂商,理论上都能看到。对金融、政务这类对数据归属极度敏感的客户来说,这一条几乎是合规上的硬伤。
海光这次给出的解法是基于 CPU+DCU 双芯架构,把芯片级的机密计算(CSV)拉通到推理全流程。简单讲,就是从 Prompt 进入算力节点开始,到模型推理、再到 Token 输出,整个生命周期的上下文数据都在加密区域里跑。而且海光的 CSV 机密计算支持多 DCU 卡直通并行推理——这一点比较关键,因为传统机密计算往往牺牲性能,多卡并行更是一道坎。
用一个不太严谨但好理解的类比:以前是给保险柜外面套了层防弹玻璃罩,现在是直接把保险柜焊在了金库墙体里。
抗量子密码:早晚得做,晚做不如早做
抗量子这件事,过去两年业界一直在喊狼来了,但真正动手在芯片层做的并不多。原因也简单——量子计算机什么时候能跑通 Shor 算法、真正威胁 RSA/ECC,谁也说不准。但金融、政务这帮客户已经开始警觉,因为有一种攻击叫"先获取、后解密"(harvest now, decrypt later):现在把你的密文拖回去存着,等量子算力到位了再慢慢拆。对要保密 20 年、30 年的金融合同和政务档案来说,这个威胁是真实的。
海光的策略可以概括成几句话:
- 全系 CPU 已经内置抗量子算法指令集,硬件底座已经铺好
- 采用"商密+抗量子密码"混合架构,传统密码、混合密码、纯抗量子密码三种模式可以平滑切换
- 不搞推倒重来,老业务不用动,新业务可以直接上抗量子
这种思路在工程上是务实的。算法替换从来都不是大问题,难的是上层应用、密钥管理、证书体系、协议栈整套生态的同步切换。SM2、SM3、SM4 和抗量子算法在密钥长度、接口协议、签名大小上差异都不小,硬要一次性切换,等于让所有业务系统集体重写。
海光副总裁应志伟的原话值得记一下:"过去密码技术迭代周期是 5 年甚至 10 年,而 CPU 迭代快得多。"这句话其实点出了内生安全的真正价值——CPU 每两年一代,把密码能力跟着 CPU 一起迭代,安全升级的节奏就被强行拉快了。

路线图:2027 推抗量子 CCP 硬件和专用指令集
6 月 11 日海光在上交会商用密码展上还透露了下一步动作:将逐步完成抗量子算法软件生态全覆盖,并推出抗量子 CCP(Cryptographic Co-Processor)硬件与专用指令集。
按应志伟此前披露的节奏:
- 2025-2026 筑基阶段:快速支持 NIST 抗量子密码标准,完成相关算法落地,软件生态完整覆盖,密钥管理打通
- 2027-2028 硬件重构阶段:推出抗量子 CCP 硬件与专用指令集,从协处理器加速进化到原生指令集加速
这里的关键是"专用指令集"。目前的抗量子算法(Kyber、Dilithium 这类基于格的方案)计算量比 RSA/ECC 大不少,纯软件实现性能压力很大。协处理器能解决一部分,但原生指令集级别的加速才是真正释放芯片算力的方式。intel 当年搞 AES-NI 把 AES 加密性能拉了一个数量级,思路是一样的。
一个判断:内生安全是国产算力的差异化牌
站在行业视角看这件事,有几个细节值得琢磨。
第一,海光走的是"芯片级原生"路线,不是"安全卡 + 加密机"那套老路。传统模式下,加密机是独立设备,性能受限于 PCIe 带宽和外部调度,关键密钥还可能在传输过程中泄露。芯片内生意味着密钥永远不离开 CPU,性能也不会被外挂瓶颈拖累。这一点在 AI 时代海量并发场景下优势会被进一步放大。
第二,海光已经联动 35 家以上合作伙伴完成了 50 多款软硬件适配,覆盖服务器密码机、安全网关等品类。生态这件事,单靠芯片厂自己干永远做不大,必须有 ISV 配合。证券、警务云、政务云项目已经落地,说明这套东西不只是 PPT。
第三,海光的 C86 架构在漏洞防御层面据称"原生免疫熔断、幽灵等重危漏洞"。这点的实际效果还需要时间验证,但从竞争视角看,这是把传统 x86 的一些历史包袱甩掉的明确动作。
第四,金融这个客户群非常挑剔,TPS 是真金白银的指标。3 万 TPS 在量子安全场景下是个相当能打的数字——要知道,纯软件实现的格密码方案在普通服务器上能跑到几千 TPS 已经不错。这个性能水平说明硬件加速确实起到了作用。
写在最后
AI 时代的安全模型确实变了。应志伟在论坛上提过一句话,原话大意是"过去安全研究人员挖一个深度漏洞要 1 到 2 年,现在 AI 模型一个晚上能挖 10 个"。攻击端的自动化能力暴涨,防御端如果还停留在打补丁、加防火墙,节奏已经追不上了。
把安全推到最底层,让密码能力跟着芯片一起迭代,这个方向在逻辑上是对的。海光这次端出的两套方案算是把这条路线落到了产品层面,金融行业的实战数据也算交了答卷。剩下的问题是生态铺开的速度——抗量子密码这个事,不是一家芯片厂能独立完成的工程,要看 ISV、客户、监管三方什么时候真正同步起来。
至少从 6 月这一波密集动作看,海光跑在前面了。

