6月16日，海光信息在上海国际金融展上端出"可信智能体引擎"和面向金融的抗量子密码方案，CPU+DCU双芯做底，单方案实测最高撑到30000 TPS，已经在银行、保险、券商落地。

海光把抗量子密码塞进了芯片，金融场景实测跑到3万TPS

6月16日，海光信息在上海国际金融展上甩出了两张牌：一张是面向大模型训练与智能体推理的"可信智能体引擎"，另一张是给金融行业准备的抗量子密码方案。两套东西的共同特征只有一个——安全能力不再外挂，而是直接刻进了 CPU 和 DCU 里。

按官方给出的数据，这套抗量子密码方案在金融场景下实测可以支撑 10000 到 30000 TPS 的高并发处理。这个数字摆在桌面上，意味着它已经不是 PoC 阶段的玩具，而是能直接进生产的工业级方案。目前海光给出的客户名单里，银行、保险、资本市场都有，落地节奏比想象中要快。

可信智能体引擎：把 Token 上下文全程加密

先说"可信智能体引擎"这个产品名，听上去像个概念，但拆开看其实指向了一个非常具体的痛点：大模型推理过程中，Token 上下文数据是明文还是密文？

过去做企业级 AI 部署的同行应该都遇到过这个尴尬——模型在云端跑，Prompt 里的合同条款、客户信息、交易策略全都得明文喂进去。即便链路加密做得再漂亮，到了 GPU 显存里依然是裸奔状态。运维人员、平台方、底层云厂商，理论上都能看到。对金融、政务这类对数据归属极度敏感的客户来说，这一条几乎是合规上的硬伤。

海光这次给出的解法是基于 CPU+DCU 双芯架构，把芯片级的机密计算（CSV）拉通到推理全流程。简单讲，就是从 Prompt 进入算力节点开始，到模型推理、再到 Token 输出，整个生命周期的上下文数据都在加密区域里跑。而且海光的 CSV 机密计算支持多 DCU 卡直通并行推理——这一点比较关键，因为传统机密计算往往牺牲性能，多卡并行更是一道坎。

用一个不太严谨但好理解的类比：以前是给保险柜外面套了层防弹玻璃罩，现在是直接把保险柜焊在了金库墙体里。

抗量子密码：早晚得做，晚做不如早做

抗量子这件事，过去两年业界一直在喊狼来了，但真正动手在芯片层做的并不多。原因也简单——量子计算机什么时候能跑通 Shor 算法、真正威胁 RSA/ECC，谁也说不准。但金融、政务这帮客户已经开始警觉，因为有一种攻击叫"先获取、后解密"（harvest now, decrypt later）：现在把你的密文拖回去存着，等量子算力到位了再慢慢拆。对要保密 20 年、30 年的金融合同和政务档案来说，这个威胁是真实的。

海光的策略可以概括成几句话：

全系 CPU 已经内置抗量子算法指令集，硬件底座已经铺好
采用"商密+抗量子密码"混合架构，传统密码、混合密码、纯抗量子密码三种模式可以平滑切换
不搞推倒重来，老业务不用动，新业务可以直接上抗量子

这种思路在工程上是务实的。算法替换从来都不是大问题，难的是上层应用、密钥管理、证书体系、协议栈整套生态的同步切换。SM2、SM3、SM4 和抗量子算法在密钥长度、接口协议、签名大小上差异都不小，硬要一次性切换，等于让所有业务系统集体重写。

海光副总裁应志伟的原话值得记一下："过去密码技术迭代周期是 5 年甚至 10 年，而 CPU 迭代快得多。"这句话其实点出了内生安全的真正价值——CPU 每两年一代，把密码能力跟着 CPU 一起迭代，安全升级的节奏就被强行拉快了。

海光CPU+DCU双芯架构与内生安全技术全景图

路线图：2027 推抗量子 CCP 硬件和专用指令集

6 月 11 日海光在上交会商用密码展上还透露了下一步动作：将逐步完成抗量子算法软件生态全覆盖，并推出抗量子 CCP（Cryptographic Co-Processor）硬件与专用指令集。

按应志伟此前披露的节奏：

2025-2026 筑基阶段：快速支持 NIST 抗量子密码标准，完成相关算法落地，软件生态完整覆盖，密钥管理打通
2027-2028 硬件重构阶段：推出抗量子 CCP 硬件与专用指令集，从协处理器加速进化到原生指令集加速

这里的关键是"专用指令集"。目前的抗量子算法（Kyber、Dilithium 这类基于格的方案）计算量比 RSA/ECC 大不少，纯软件实现性能压力很大。协处理器能解决一部分，但原生指令集级别的加速才是真正释放芯片算力的方式。intel 当年搞 AES-NI 把 AES 加密性能拉了一个数量级，思路是一样的。

一个判断：内生安全是国产算力的差异化牌

站在行业视角看这件事，有几个细节值得琢磨。

第一，海光走的是"芯片级原生"路线，不是"安全卡 + 加密机"那套老路。传统模式下，加密机是独立设备，性能受限于 PCIe 带宽和外部调度，关键密钥还可能在传输过程中泄露。芯片内生意味着密钥永远不离开 CPU，性能也不会被外挂瓶颈拖累。这一点在 AI 时代海量并发场景下优势会被进一步放大。

第二，海光已经联动 35 家以上合作伙伴完成了 50 多款软硬件适配，覆盖服务器密码机、安全网关等品类。生态这件事，单靠芯片厂自己干永远做不大，必须有 ISV 配合。证券、警务云、政务云项目已经落地，说明这套东西不只是 PPT。

第三，海光的 C86 架构在漏洞防御层面据称"原生免疫熔断、幽灵等重危漏洞"。这点的实际效果还需要时间验证，但从竞争视角看，这是把传统 x86 的一些历史包袱甩掉的明确动作。

第四，金融这个客户群非常挑剔，TPS 是真金白银的指标。3 万 TPS 在量子安全场景下是个相当能打的数字——要知道，纯软件实现的格密码方案在普通服务器上能跑到几千 TPS 已经不错。这个性能水平说明硬件加速确实起到了作用。

写在最后

AI 时代的安全模型确实变了。应志伟在论坛上提过一句话，原话大意是"过去安全研究人员挖一个深度漏洞要 1 到 2 年，现在 AI 模型一个晚上能挖 10 个"。攻击端的自动化能力暴涨，防御端如果还停留在打补丁、加防火墙，节奏已经追不上了。

把安全推到最底层，让密码能力跟着芯片一起迭代，这个方向在逻辑上是对的。海光这次端出的两套方案算是把这条路线落到了产品层面，金融行业的实战数据也算交了答卷。剩下的问题是生态铺开的速度——抗量子密码这个事，不是一家芯片厂能独立完成的工程，要看 ISV、客户、监管三方什么时候真正同步起来。

至少从 6 月这一波密集动作看，海光跑在前面了。

海光把抗量子密码塞进了芯片，金融场景实测跑到3万TPS

海光把抗量子密码塞进了芯片，金融场景实测跑到3万TPS

可信智能体引擎：把 Token 上下文全程加密

抗量子密码：早晚得做，晚做不如早做

路线图：2027 推抗量子 CCP 硬件和专用指令集

一个判断：内生安全是国产算力的差异化牌

写在最后

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们