Snowflake 与 AWS 签 60 亿美元协议，押注 Trainium 部署企业 Agent

Snowflake 与 AWS 签下五年期 60 亿美元战略合作协议，全面采购 AWS 自研 AI 芯片，用于其数据云平台的 Agent 训练与推理。这是 Snowflake 史上最大单笔基础设施投入，也是 Trainium 阵营对 Nvidia 的又一次正面叫板。

Snowflake 把家底押在了 AWS 自研芯片上

5 月 27 日，Snowflake 宣布与 AWS 续签战略合作协议（SCA），未来五年向 AWS 投入 60 亿美元，用于采购 AI 计算资源、扩建底层基础设施，重点支撑其数据云上的 Agent 训练与推理负载。这是 Snowflake 上市以来最大的一笔基础设施承诺，单笔金额超过其 2025 财年全年的产品收入。

这件事如果只看新闻标题，很容易当成又一笔云厂大单。但拆开看，里面其实是三条线在同时收紧：Snowflake 的 Agent 路线需要更便宜的算力、AWS 的自研芯片需要旗舰客户站台、Nvidia 在企业数据平台这一侧的份额正在被一点点蚕食。

Snowflake CEO Sridhar Ramaswamy 与 AWS CEO Matt Garman 在合作发布会上的场景

60 亿美元到底买了什么

根据 Snowflake 和 AWS 披露的协议要点，这 60 亿美元并不是简单的"云消费承诺"（committed spend），而是涵盖三部分：

AI 加速芯片采购：Snowflake 将大规模采用 AWS 自研的 Trainium2 和下一代 Trainium3 芯片，用于 Cortex AI 平台上的模型训练与微调任务，同时在推理侧引入 Inferentia 系列。
底层基础设施扩展：在 AWS us-east、us-west 以及欧洲、亚太多个 region 增设专用容量，用于承接企业级 Agent 工作负载。
联合产品研发：双方将在 Agent Compute、向量检索、跨账户数据共享等方向上做深度集成，Snowflake 的 Cortex Agents 会原生对接 Amazon Bedrock AgentCore。

TechCrunch 在报道里用了一个比较直白的说法：这是一笔"AI CPU 芯片"的大单。措辞虽然不算严谨——Trainium 本质上是 AI 加速器而不是通用 CPU——但传达的信号没错：Snowflake 这一次没有选 H100/H200，也没有等 B200，而是把训练侧的主力筹码压在了 AWS 自家硅片上。

为什么是现在，为什么是 Trainium

过去两年，Snowflake 在 AI 方向上的姿态变化非常明显。从最早强调"数据不出云"的封闭策略，到 2024 年陆续接入 Llama、Mistral，再到 2025 年底与 Anthropic 签下 2 亿美元协议把 Claude 引入 Cortex，最近半年又把 Cortex Agents 推到台前——这家公司的角色已经从"数据仓库"转向"企业 AI 运行时"。

问题是，Agent 工作负载和传统 SQL 查询完全不是一回事。一次复杂的 Agent 调用，可能涉及：

多轮 LLM 推理（每轮几千到几万 token）
向量检索 + 重排
工具调用（数据库查询、API、代码执行）
中间状态持久化

这种负载的特征是长尾、突发、且严重 token-bound。如果用 Nvidia H100 撑，单位 token 成本压不下来；如果走纯 API 转售路线，Snowflake 又拿不到毛利。Trainium2 的吸引力恰恰在这里：AWS 官方披露的数字是相比同代 GPU 实例，性价比提升约 30%-40%，而且在 AWS 自家的网络拓扑里，跨节点通信延迟更可控。

对 Snowflake 来说，押注 Trainium 是一笔典型的"用承诺换价格"的交易——五年 60 亿的体量足够让 AWS 给出深度折扣，反过来也帮 AWS 把 Trainium 的产能利用率拉满。

Nvidia 又一次被"点名"

这两年企业级 AI 大单里，越来越多出现"绕开 Nvidia"的影子。去年 Anthropic 拿了 AWS 数十亿美元投资、用 Trainium 训练 Claude；今年初 Apple 被曝在内部测试用 Trainium 替换部分推理负载；现在轮到 Snowflake。

这不意味着 Nvidia 的霸主地位被动摇——超大规模训练任务、前沿模型预训练这条主航道，Nvidia 仍然牢牢握着。但在"企业 AI 应用层"这个市场，逻辑正在变化：

客户买的是结果，不是硬件。Snowflake 的甲方根本不在乎底层是 Trainium 还是 H100，他们只看每千 token 多少钱、SLA 是否达标。
云厂商有捆绑优势。AWS 可以把芯片、网络、存储、计费打包卖，Nvidia 只能卖 GPU。
推理市场正在膨胀。Agent 时代，推理调用量会是预训练的几个数量级，谁掌握推理性价比，谁就拿走规模利润。

Nvidia 也不是没动作——黄仁勋在最近一次 GTC 上反复强调 Blackwell 在推理端的优势，但企业客户实际签合同的时候，价格摆在那里。

Cortex Agents 和 Bedrock AgentCore 的拼图

协议里最值得细看的，其实是产品集成那一块。Snowflake Cortex Agents 之前的定位是"在数据上跑 Agent"——开发者可以基于企业自己的表、view、Iceberg 表，定义一个能查询、能调用工具、能持久化记忆的 Agent。它的卖点是数据不离开 Snowflake 治理边界。

但 Cortex Agents 一直缺一块拼图：跨企业边界的工具调用和外部服务编排。这正好是 Amazon Bedrock AgentCore 擅长的——AgentCore 提供了 runtime、memory、identity、gateway 四件套，专门处理 Agent 在生产环境的部署问题。

这次合作之后，二者将原生互通。一个比较具体的场景是：

用户在 Snowflake 里定义了一个销售分析 Agent，能访问 CRM 数据、订单表、产品库存
当 Agent 需要给客户发邮件、调用外部 SaaS（比如 Salesforce、Slack）时，自动切换到 Bedrock AgentCore Gateway 完成认证和调用
整个对话历史、工具调用日志、token 消耗，统一回写到 Snowflake 的治理面板

这种"数据治理 + Agent runtime"的组合，对企业 IT 部门来说是相当有杀伤力的——它解决了过去一年 Agent 落地最大的两个痛点：数据怎么不外泄、出了问题怎么审计。

对开发者意味着什么

如果你正在企业里做 Agent 项目，这次合作其实带来了几个可以立即关注的变化：

Cortex 上的模型成本会下降。Trainium 替换 GPU 之后，Snowflake 有空间把 Cortex 的按 token 计费再压一档，Anthropic Claude 系列在 Cortex 上的价格也可能跟着调整。
Agent 部署链路缩短。原本要在 Snowflake 和 Bedrock 之间手动拼接的部分，未来会通过原生 connector 暴露，少写一大堆 IAM 和网络配置。
多模型策略更现实。Snowflake Cortex 已经支持 Claude、Llama、Mistral、Snowflake 自家的 Arctic 系列，加上未来对 Bedrock 上 Nova、Titan 的打通，事实上变成了一个企业版的多模型路由层。

顺带一提，对于不想被绑死在某一家云厂的开发者，目前也有走兼容 OpenAI 协议的聚合层路线（比如 OpenAI Hub 这类一个 Key 通调 GPT、Claude、Gemini、DeepSeek 的服务）做模型层抽象，再把数据和编排留在自己的基础设施里——这条路在国内场景下尤其常见，相对独立于云厂自身的 Agent 套件。

一个不太被讨论的细节：营收结构

这笔 60 亿美元，市场分析师关注的点其实有两层。第一层是 AWS 拿到了又一个 anchor customer，给 Trainium 的故事添了筹码——Amazon 股价在协议公布当天涨了 2.3%。第二层是 Snowflake 这边：60 亿是支出，但同时也是"未来收入"的支撑。

Snowflake 上一季财报里，product revenue 同比增长 27%，其中 AI 相关收入贡献占比从去年的个位数提升到 18% 左右。这次和 AWS 的协议，本质上是把未来五年 AI 业务的算力底座锁定下来——既能让客户放心做长期项目，也给华尔街一个"AI 营收兑现路径"的明确叙事。

但代价也很清晰：毛利率会在短期内承压。Snowflake 之前的非 GAAP 产品毛利率维持在 75% 以上，AI 工作负载本身是低毛利的生意，未来几个季度这个数字大概率会被拉低 3-5 个百分点。CFO 在电话会上对这一点已经做了预期管理：用毛利率换增长，是这个阶段必须的取舍。

写在最后

如果把这两年企业 AI 的大额合作摆在一起看，会发现一个相当明显的趋势：钱在从"卖模型"流向"卖运行 Agent 的能力"。OpenAI 拿微软的算力、Anthropic 拿 AWS 的算力、Snowflake 押 Trainium、Databricks 也在和多家芯片厂谈深度合作。

上一波浪潮大家比的是模型参数和 benchmark，这一波比的是：谁能让企业的 Agent 真正跑起来、跑得便宜、跑得合规。Snowflake 这 60 亿，下注的就是这个判断。

至于会不会赢，五年之后再看吧。

参考来源

Reddit 关于 AWS Trainium2 与 Nvidia H100 性价比对比的讨论 — 社区里对 Trainium 实际推理性能的一手反馈
Hugging Face 上 AWS Neuron SDK 相关模型仓库 — 用于在 Trainium/Inferentia 上部署模型的官方工具链
Stack Overflow 上 Snowflake Cortex Agents 集成讨论 — 开发者社区关于 Cortex Agents 与外部服务集成的实践问答

Snowflake 押注 60 亿美元，把企业 Agent 训练搬上 AWS