OpenAI 模型空降 AWS Bedrock:GPT-5.5、5.4 与 Codex 一并开放

产品更新

6月1日,AWS 正式宣布 OpenAI 的 GPT-5.5、GPT-5.4 与 Codex 上线 Amazon Bedrock,定价对齐 OpenAI 一方价格、无额外加价。这是 OpenAI 闭源旗舰模型首次原生进入 AWS 生态。

6月1日,AWS 在 Bedrock 的模型目录里悄悄多了两行:openai.gpt-5.5openai.gpt-5.4。再加上同步登陆的 Codex(限量预览)以及由 OpenAI 模型驱动的 Bedrock Managed Agents,这是 OpenAI 闭源旗舰模型第一次原生进入 AWS 生态——不是通过第三方代理,不是通过 Azure 转一道手,而是直接在 Bedrock 的 API 后面。

对企业客户来说,这件事的信号意义比技术意义更大。过去两年里,「OpenAI 模型只能通过 Azure OpenAI 服务在云上稳定调用」几乎是一条默认规则,AWS 上的客户要用 GPT,要么自己接 OpenAI 公网 API(合规层面绕不过 VPC peering 的问题),要么走第三方聚合服务。现在 AWS 直接把这条路打通了,而且——这是最值得关注的细节——Bedrock 上的 OpenAI 模型定价和 OpenAI 一方 API 完全一致,AWS 没有加价

AWS Bedrock 控制台中新增的 OpenAI 模型卡片,包含 GPT-5.5、GPT-5.4 与 Codex

这次到底上了什么

这次发布实际上是三块东西捆在一起的:

1. OpenAI 模型上 Bedrock:包括目前 OpenAI 最强的前沿模型 GPT-5.5、定位在性价比段的 GPT-5.4。两者都通过标准 Bedrock InvokeModel / Converse API 调用,沿用 IAM、KMS、CloudTrail 那一整套 AWS 既有的安全与审计体系。AWS 同时给出了 Mantle 和 Runtime 两条路径——Mantle 是 AWS 推的新一代低延迟端点,对工具调用和长上下文场景做了链路优化。

2. Codex 上 AWS:Codex 是 OpenAI 的前沿编程平台与产品套件。这次组织可以让 Codex 用 Bedrock 上的 OpenAI 模型作为后端——配置层面就是把 Codex 的 provider 指到 Bedrock,首发支持 Codex CLI、Codex 桌面应用、以及 VS Code 扩展。客户数据完全由 Bedrock 处理,符合资格的客户还能把 Codex 用量计入自己的 AWS 云承诺消费。这一点对那些已经签了大额 AWS EDP 合同的企业很关键,等于变相打了折。

3. OpenAI 驱动的 Bedrock Managed Agents:这是 AWS 把 Agent 编排平台化的尝试,由 OpenAI 模型提供推理能力。开发者不用自己拼 orchestration、tool calling、memory、guardrails,Bedrock 来管。目标是把 Agent 从「能跑 demo」推到「能跑生产」的距离缩短。

价格对齐,意味着什么

「价格与 OpenAI 一方一致」这句话听上去平平无奇,但对熟悉云厂商商业模型的人来说,这是个反常的让步。

云厂商代理上游 API,常规做法是加一层 markup——Azure OpenAI Service 早期也是这么干的,只不过用「企业级 SLA + 数据驻留」把溢价包装得合理。AWS 这次没加价,等于把 Bedrock 当作零边际利润的渠道来做。原因不难推测:AWS 在生成式 AI 这一仗里被 Azure 用 OpenAI 这张牌压了两年,自家的 Titan 系列没打开局面,Anthropic 是亲儿子但只占半张牌桌。把 OpenAI 拉进 Bedrock,AWS 要的是留住那些「为了用 GPT 不得不在 AWS 之外开第二朵云」的企业客户。这笔账,让出 markup 是划算的。

OpenAI 的算盘也清楚:AWS 占了大约三分之一的全球公有云份额,里面沉淀着海量企业工作负载。这些客户的合规、计费、安全审计全都建在 AWS 上,让他们「为了一个模型再去对接一朵云」是反摩擦的。直接进 Bedrock,等于把分发渠道接到了对方的水管上。

对开发者意味着什么

从工程视角看,几个变化是实打实的:

  • 数据驻留与合规:调用 GPT-5.5 时,请求和响应都在你选择的 AWS region 里走 Bedrock,不出 AWS 边界。对金融、医疗、政府这类对数据出境敏感的客户来说,这是个真正能落地的方案。
  • IAM 而不是 API Key:身份管理走 AWS IAM 角色与策略,不用再单独管理一套 OpenAI API Key 的发放、轮转、撤销。对中大型组织的安全团队是减负。
  • 统一计费:用量直接进 AWS 账单,可以并入 EDP 承诺消费。财务那边不用再为「OpenAI 那张信用卡账单」单独开流程。
  • Codex 走 Bedrock:对那些已经在 AWS 上做 CI/CD 的工程组织,把 Codex 接进来比之前接 OpenAI 公网 API 简单不少。VS Code 扩展和 CLI 都已经支持。

但也要泼点冷水。Codex on Bedrock 和 Managed Agents 目前都是 limited preview,要走申请通道;区域覆盖也有限,根据 AWS 文档,初期主要在 us-east-1us-east-2us-west-2 跑得通,亚太区域基本要等。国内的 AWS 中国区(北京、宁夏)目前没有任何相关信息——按照过往节奏,OpenAI 模型短期内进中国区的可能性几乎为零。

GPT-5.5 和 5.4 怎么选

GPT-5.5 是 OpenAI 当前的旗舰前沿模型,长上下文、复杂推理、Agent 任务上是首选。GPT-5.4 则更像是上一代旗舰下放到「日常生产负载」的位置——延迟更低、单 token 价格更便宜,对那些需要高并发、对响应时间敏感的场景(客服、检索增强、批量内容处理)更划算。

实际选型上的经验是:先用 5.5 把任务效果做到位,再看能不能降到 5.4 跑通;不要反过来,因为 5.4 跑不通的时候你不一定能判断是 prompt 问题还是模型能力问题。

调用示例

如果你已经有 Bedrock 访问权限,调用 GPT-5.5 的方式基本就是标准的 Bedrock Converse API:

import boto3

client = boto3.client("bedrock-runtime", region_name="us-west-2")

response = client.converse(
    modelId="openai.gpt-5.5",
    messages=[
        {
            "role": "user",
            "content": [{"text": "用一段话解释 MoE 架构的核心思想"}],
        }
    ],
    inferenceConfig={
        "maxTokens": 1024,
        "temperature": 0.7,
    },
)

print(response["output"]["message"]["content"][0]["text"])

对于不想被锁死在 Bedrock SDK 里、或者希望同一份代码能同时切 Claude、Gemini、DeepSeek 等模型的开发者,可以走 OpenAI Hub 这种聚合层,一个 Key 调所有主流模型,接口完全兼容 OpenAI 格式,国内直连:

from openai import OpenAI

client = OpenAI(
    api_key="your-openai-hub-key",
    base_url="https://api.openai-hub.com/v1",
)

resp = client.chat.completions.create(
    model="gpt-5.5",
    messages=[
        {"role": "user", "content": "用一段话解释 MoE 架构的核心思想"}
    ],
)
print(resp.choices[0].message.content)

两种姿势的差别:Bedrock 适合「已经全栈 AWS、要的就是 IAM/VPC/CloudTrail 闭环」的企业团队;聚合层适合「多模型横向对比、原型迭代、不想被单一厂商绑死」的开发者和小团队。

一个被忽略的细节:Codex 算 AWS 承诺消费

这条藏在公告里的细节,价值可能比头条更大。

大型企业和 AWS 签的 EDP(Enterprise Discount Program)合同通常是「未来 N 年承诺花掉 X 千万美元,换取整体折扣」。承诺消费用不掉,等于打水漂。Codex 用量能计入这部分预算,意味着对一家已经签了 EDP 的公司来说,用 Codex 几乎是「不花新钱」。这对 OpenAI 在企业编程市场抢 GitHub Copilot 的份额,是一个非常实在的杠杆。

Copilot 背靠 Azure 与 GitHub,过去在企业渠道几乎没有对手。Codex 通过 Bedrock 切到 AWS 客户的承诺预算里,是直接在 Copilot 的腹地开了一道口子。

Bedrock 上的 Agent 这盘棋

Managed Agents 这块更值得长线观察。AWS 想做的不只是「卖模型 token」,而是把 Agent 的运行时——orchestration、工具调用、状态管理、安全护栏——做成一个托管层。OpenAI 提供推理大脑,AWS 提供企业级的运行躯壳。

这条路线和 Anthropic 力推的 Claude Agent SDK 是直接对位的。区别在于:Anthropic 的方案更偏 SDK + 开发者自由组合;AWS Managed Agents 更偏「全托管、点几下控制台就能上线」,目标客户画像不完全一样。对中后台、客服、内部工具这类场景,托管路线的吸引力更大;对追求灵活度的产品团队,SDK 路线更顺手。

几个还没说清的问题

这次发布也留了一些悬念:

  • 限流策略:Bedrock 上 OpenAI 模型的 RPM/TPM 配额怎么算,是否和 OpenAI 一方共享池,AWS 没有给出明确说法。
  • 新模型节奏:OpenAI 即将发布的 GPT-5.6 会不会同步上 Bedrock,还是先在 OpenAI 一方独占一段时间,没有时间表。
  • 微调能力:目前公告里没有提 fine-tuning 是否开放,Bedrock 上现有的 Anthropic 模型也只有部分支持,这块大概率要等。
  • Codex on Bedrock 的实测体验:直连 OpenAI 后端的 Codex 已经在开发者社区有不少口碑数据,走 Bedrock 这条路径延迟和稳定性如何,要等 limited preview 放量才能看清。

写在最后

OpenAI 进 Bedrock,表面上是渠道扩张,里子是云厂商和模型厂商的关系再平衡。Azure 用 OpenAI 独占性换了两年红利,现在 OpenAI 把同样的牌也给了 AWS——这意味着模型厂商不再愿意被任何单一云绑定,云厂商也接受了「自家模型打不赢就代理」这件事。

对开发者来说,结果是好的:选择更多、价格透明、合规路径变短。无论你是已经全套 AWS 的企业团队,还是只想用一个统一接口横跨多家模型的独立开发者,今天能用的工具都比一年前丰富了不止一个数量级。

这场仗远没打完,但至少 Bedrock 的牌桌上,终于摆齐了。

参考来源