Snowflake 把家底押在了 AWS 自研芯片上
5 月 27 日,Snowflake 宣布与 AWS 续签战略合作协议(SCA),未来五年向 AWS 投入 60 亿美元,用于采购 AI 计算资源、扩建底层基础设施,重点支撑其数据云上的 Agent 训练与推理负载。这是 Snowflake 上市以来最大的一笔基础设施承诺,单笔金额超过其 2025 财年全年的产品收入。
这件事如果只看新闻标题,很容易当成又一笔云厂大单。但拆开看,里面其实是三条线在同时收紧:Snowflake 的 Agent 路线需要更便宜的算力、AWS 的自研芯片需要旗舰客户站台、Nvidia 在企业数据平台这一侧的份额正在被一点点蚕食。

60 亿美元到底买了什么
根据 Snowflake 和 AWS 披露的协议要点,这 60 亿美元并不是简单的"云消费承诺"(committed spend),而是涵盖三部分:
- AI 加速芯片采购:Snowflake 将大规模采用 AWS 自研的 Trainium2 和下一代 Trainium3 芯片,用于 Cortex AI 平台上的模型训练与微调任务,同时在推理侧引入 Inferentia 系列。
- 底层基础设施扩展:在 AWS us-east、us-west 以及欧洲、亚太多个 region 增设专用容量,用于承接企业级 Agent 工作负载。
- 联合产品研发:双方将在 Agent Compute、向量检索、跨账户数据共享等方向上做深度集成,Snowflake 的 Cortex Agents 会原生对接 Amazon Bedrock AgentCore。
TechCrunch 在报道里用了一个比较直白的说法:这是一笔"AI CPU 芯片"的大单。措辞虽然不算严谨——Trainium 本质上是 AI 加速器而不是通用 CPU——但传达的信号没错:Snowflake 这一次没有选 H100/H200,也没有等 B200,而是把训练侧的主力筹码压在了 AWS 自家硅片上。
为什么是现在,为什么是 Trainium
过去两年,Snowflake 在 AI 方向上的姿态变化非常明显。从最早强调"数据不出云"的封闭策略,到 2024 年陆续接入 Llama、Mistral,再到 2025 年底与 Anthropic 签下 2 亿美元协议把 Claude 引入 Cortex,最近半年又把 Cortex Agents 推到台前——这家公司的角色已经从"数据仓库"转向"企业 AI 运行时"。
问题是,Agent 工作负载和传统 SQL 查询完全不是一回事。一次复杂的 Agent 调用,可能涉及:
- 多轮 LLM 推理(每轮几千到几万 token)
- 向量检索 + 重排
- 工具调用(数据库查询、API、代码执行)
- 中间状态持久化
这种负载的特征是长尾、突发、且严重 token-bound。如果用 Nvidia H100 撑,单位 token 成本压不下来;如果走纯 API 转售路线,Snowflake 又拿不到毛利。Trainium2 的吸引力恰恰在这里:AWS 官方披露的数字是相比同代 GPU 实例,性价比提升约 30%-40%,而且在 AWS 自家的网络拓扑里,跨节点通信延迟更可控。
对 Snowflake 来说,押注 Trainium 是一笔典型的"用承诺换价格"的交易——五年 60 亿的体量足够让 AWS 给出深度折扣,反过来也帮 AWS 把 Trainium 的产能利用率拉满。
Nvidia 又一次被"点名"
这两年企业级 AI 大单里,越来越多出现"绕开 Nvidia"的影子。去年 Anthropic 拿了 AWS 数十亿美元投资、用 Trainium 训练 Claude;今年初 Apple 被曝在内部测试用 Trainium 替换部分推理负载;现在轮到 Snowflake。
这不意味着 Nvidia 的霸主地位被动摇——超大规模训练任务、前沿模型预训练这条主航道,Nvidia 仍然牢牢握着。但在"企业 AI 应用层"这个市场,逻辑正在变化:
- 客户买的是结果,不是硬件。Snowflake 的甲方根本不在乎底层是 Trainium 还是 H100,他们只看每千 token 多少钱、SLA 是否达标。
- 云厂商有捆绑优势。AWS 可以把芯片、网络、存储、计费打包卖,Nvidia 只能卖 GPU。
- 推理市场正在膨胀。Agent 时代,推理调用量会是预训练的几个数量级,谁掌握推理性价比,谁就拿走规模利润。
Nvidia 也不是没动作——黄仁勋在最近一次 GTC 上反复强调 Blackwell 在推理端的优势,但企业客户实际签合同的时候,价格摆在那里。
Cortex Agents 和 Bedrock AgentCore 的拼图
协议里最值得细看的,其实是产品集成那一块。Snowflake Cortex Agents 之前的定位是"在数据上跑 Agent"——开发者可以基于企业自己的表、view、Iceberg 表,定义一个能查询、能调用工具、能持久化记忆的 Agent。它的卖点是数据不离开 Snowflake 治理边界。
但 Cortex Agents 一直缺一块拼图:跨企业边界的工具调用和外部服务编排。这正好是 Amazon Bedrock AgentCore 擅长的——AgentCore 提供了 runtime、memory、identity、gateway 四件套,专门处理 Agent 在生产环境的部署问题。
这次合作之后,二者将原生互通。一个比较具体的场景是:
- 用户在 Snowflake 里定义了一个销售分析 Agent,能访问 CRM 数据、订单表、产品库存
- 当 Agent 需要给客户发邮件、调用外部 SaaS(比如 Salesforce、Slack)时,自动切换到 Bedrock AgentCore Gateway 完成认证和调用
- 整个对话历史、工具调用日志、token 消耗,统一回写到 Snowflake 的治理面板
这种"数据治理 + Agent runtime"的组合,对企业 IT 部门来说是相当有杀伤力的——它解决了过去一年 Agent 落地最大的两个痛点:数据怎么不外泄、出了问题怎么审计。
对开发者意味着什么
如果你正在企业里做 Agent 项目,这次合作其实带来了几个可以立即关注的变化:
- Cortex 上的模型成本会下降。Trainium 替换 GPU 之后,Snowflake 有空间把 Cortex 的按 token 计费再压一档,Anthropic Claude 系列在 Cortex 上的价格也可能跟着调整。
- Agent 部署链路缩短。原本要在 Snowflake 和 Bedrock 之间手动拼接的部分,未来会通过原生 connector 暴露,少写一大堆 IAM 和网络配置。
- 多模型策略更现实。Snowflake Cortex 已经支持 Claude、Llama、Mistral、Snowflake 自家的 Arctic 系列,加上未来对 Bedrock 上 Nova、Titan 的打通,事实上变成了一个企业版的多模型路由层。
顺带一提,对于不想被绑死在某一家云厂的开发者,目前也有走兼容 OpenAI 协议的聚合层路线(比如 OpenAI Hub 这类一个 Key 通调 GPT、Claude、Gemini、DeepSeek 的服务)做模型层抽象,再把数据和编排留在自己的基础设施里——这条路在国内场景下尤其常见,相对独立于云厂自身的 Agent 套件。
一个不太被讨论的细节:营收结构
这笔 60 亿美元,市场分析师关注的点其实有两层。第一层是 AWS 拿到了又一个 anchor customer,给 Trainium 的故事添了筹码——Amazon 股价在协议公布当天涨了 2.3%。第二层是 Snowflake 这边:60 亿是支出,但同时也是"未来收入"的支撑。
Snowflake 上一季财报里,product revenue 同比增长 27%,其中 AI 相关收入贡献占比从去年的个位数提升到 18% 左右。这次和 AWS 的协议,本质上是把未来五年 AI 业务的算力底座锁定下来——既能让客户放心做长期项目,也给华尔街一个"AI 营收兑现路径"的明确叙事。
但代价也很清晰:毛利率会在短期内承压。Snowflake 之前的非 GAAP 产品毛利率维持在 75% 以上,AI 工作负载本身是低毛利的生意,未来几个季度这个数字大概率会被拉低 3-5 个百分点。CFO 在电话会上对这一点已经做了预期管理:用毛利率换增长,是这个阶段必须的取舍。
写在最后
如果把这两年企业 AI 的大额合作摆在一起看,会发现一个相当明显的趋势:钱在从"卖模型"流向"卖运行 Agent 的能力"。OpenAI 拿微软的算力、Anthropic 拿 AWS 的算力、Snowflake 押 Trainium、Databricks 也在和多家芯片厂谈深度合作。
上一波浪潮大家比的是模型参数和 benchmark,这一波比的是:谁能让企业的 Agent 真正跑起来、跑得便宜、跑得合规。Snowflake 这 60 亿,下注的就是这个判断。
至于会不会赢,五年之后再看吧。
参考来源
- Reddit 关于 AWS Trainium2 与 Nvidia H100 性价比对比的讨论 — 社区里对 Trainium 实际推理性能的一手反馈
- Hugging Face 上 AWS Neuron SDK 相关模型仓库 — 用于在 Trainium/Inferentia 上部署模型的官方工具链
- Stack Overflow 上 Snowflake Cortex Agents 集成讨论 — 开发者社区关于 Cortex Agents 与外部服务集成的实践问答