6月1日,AWS 在 Bedrock 的模型目录里悄悄多了两行:openai.gpt-5.5 和 openai.gpt-5.4。再加上同步登陆的 Codex(限量预览)以及由 OpenAI 模型驱动的 Bedrock Managed Agents,这是 OpenAI 闭源旗舰模型第一次原生进入 AWS 生态——不是通过第三方代理,不是通过 Azure 转一道手,而是直接在 Bedrock 的 API 后面。
对企业客户来说,这件事的信号意义比技术意义更大。过去两年里,「OpenAI 模型只能通过 Azure OpenAI 服务在云上稳定调用」几乎是一条默认规则,AWS 上的客户要用 GPT,要么自己接 OpenAI 公网 API(合规层面绕不过 VPC peering 的问题),要么走第三方聚合服务。现在 AWS 直接把这条路打通了,而且——这是最值得关注的细节——Bedrock 上的 OpenAI 模型定价和 OpenAI 一方 API 完全一致,AWS 没有加价。

这次到底上了什么
这次发布实际上是三块东西捆在一起的:
1. OpenAI 模型上 Bedrock:包括目前 OpenAI 最强的前沿模型 GPT-5.5、定位在性价比段的 GPT-5.4。两者都通过标准 Bedrock InvokeModel / Converse API 调用,沿用 IAM、KMS、CloudTrail 那一整套 AWS 既有的安全与审计体系。AWS 同时给出了 Mantle 和 Runtime 两条路径——Mantle 是 AWS 推的新一代低延迟端点,对工具调用和长上下文场景做了链路优化。
2. Codex 上 AWS:Codex 是 OpenAI 的前沿编程平台与产品套件。这次组织可以让 Codex 用 Bedrock 上的 OpenAI 模型作为后端——配置层面就是把 Codex 的 provider 指到 Bedrock,首发支持 Codex CLI、Codex 桌面应用、以及 VS Code 扩展。客户数据完全由 Bedrock 处理,符合资格的客户还能把 Codex 用量计入自己的 AWS 云承诺消费。这一点对那些已经签了大额 AWS EDP 合同的企业很关键,等于变相打了折。
3. OpenAI 驱动的 Bedrock Managed Agents:这是 AWS 把 Agent 编排平台化的尝试,由 OpenAI 模型提供推理能力。开发者不用自己拼 orchestration、tool calling、memory、guardrails,Bedrock 来管。目标是把 Agent 从「能跑 demo」推到「能跑生产」的距离缩短。
价格对齐,意味着什么
「价格与 OpenAI 一方一致」这句话听上去平平无奇,但对熟悉云厂商商业模型的人来说,这是个反常的让步。
云厂商代理上游 API,常规做法是加一层 markup——Azure OpenAI Service 早期也是这么干的,只不过用「企业级 SLA + 数据驻留」把溢价包装得合理。AWS 这次没加价,等于把 Bedrock 当作零边际利润的渠道来做。原因不难推测:AWS 在生成式 AI 这一仗里被 Azure 用 OpenAI 这张牌压了两年,自家的 Titan 系列没打开局面,Anthropic 是亲儿子但只占半张牌桌。把 OpenAI 拉进 Bedrock,AWS 要的是留住那些「为了用 GPT 不得不在 AWS 之外开第二朵云」的企业客户。这笔账,让出 markup 是划算的。
OpenAI 的算盘也清楚:AWS 占了大约三分之一的全球公有云份额,里面沉淀着海量企业工作负载。这些客户的合规、计费、安全审计全都建在 AWS 上,让他们「为了一个模型再去对接一朵云」是反摩擦的。直接进 Bedrock,等于把分发渠道接到了对方的水管上。
对开发者意味着什么
从工程视角看,几个变化是实打实的:
- 数据驻留与合规:调用 GPT-5.5 时,请求和响应都在你选择的 AWS region 里走 Bedrock,不出 AWS 边界。对金融、医疗、政府这类对数据出境敏感的客户来说,这是个真正能落地的方案。
- IAM 而不是 API Key:身份管理走 AWS IAM 角色与策略,不用再单独管理一套 OpenAI API Key 的发放、轮转、撤销。对中大型组织的安全团队是减负。
- 统一计费:用量直接进 AWS 账单,可以并入 EDP 承诺消费。财务那边不用再为「OpenAI 那张信用卡账单」单独开流程。
- Codex 走 Bedrock:对那些已经在 AWS 上做 CI/CD 的工程组织,把 Codex 接进来比之前接 OpenAI 公网 API 简单不少。VS Code 扩展和 CLI 都已经支持。
但也要泼点冷水。Codex on Bedrock 和 Managed Agents 目前都是 limited preview,要走申请通道;区域覆盖也有限,根据 AWS 文档,初期主要在 us-east-1、us-east-2、us-west-2 跑得通,亚太区域基本要等。国内的 AWS 中国区(北京、宁夏)目前没有任何相关信息——按照过往节奏,OpenAI 模型短期内进中国区的可能性几乎为零。
GPT-5.5 和 5.4 怎么选
GPT-5.5 是 OpenAI 当前的旗舰前沿模型,长上下文、复杂推理、Agent 任务上是首选。GPT-5.4 则更像是上一代旗舰下放到「日常生产负载」的位置——延迟更低、单 token 价格更便宜,对那些需要高并发、对响应时间敏感的场景(客服、检索增强、批量内容处理)更划算。
实际选型上的经验是:先用 5.5 把任务效果做到位,再看能不能降到 5.4 跑通;不要反过来,因为 5.4 跑不通的时候你不一定能判断是 prompt 问题还是模型能力问题。
调用示例
如果你已经有 Bedrock 访问权限,调用 GPT-5.5 的方式基本就是标准的 Bedrock Converse API:
import boto3
client = boto3.client("bedrock-runtime", region_name="us-west-2")
response = client.converse(
modelId="openai.gpt-5.5",
messages=[
{
"role": "user",
"content": [{"text": "用一段话解释 MoE 架构的核心思想"}],
}
],
inferenceConfig={
"maxTokens": 1024,
"temperature": 0.7,
},
)
print(response["output"]["message"]["content"][0]["text"])
对于不想被锁死在 Bedrock SDK 里、或者希望同一份代码能同时切 Claude、Gemini、DeepSeek 等模型的开发者,可以走 OpenAI Hub 这种聚合层,一个 Key 调所有主流模型,接口完全兼容 OpenAI 格式,国内直连:
from openai import OpenAI
client = OpenAI(
api_key="your-openai-hub-key",
base_url="https://api.openai-hub.com/v1",
)
resp = client.chat.completions.create(
model="gpt-5.5",
messages=[
{"role": "user", "content": "用一段话解释 MoE 架构的核心思想"}
],
)
print(resp.choices[0].message.content)
两种姿势的差别:Bedrock 适合「已经全栈 AWS、要的就是 IAM/VPC/CloudTrail 闭环」的企业团队;聚合层适合「多模型横向对比、原型迭代、不想被单一厂商绑死」的开发者和小团队。
一个被忽略的细节:Codex 算 AWS 承诺消费
这条藏在公告里的细节,价值可能比头条更大。
大型企业和 AWS 签的 EDP(Enterprise Discount Program)合同通常是「未来 N 年承诺花掉 X 千万美元,换取整体折扣」。承诺消费用不掉,等于打水漂。Codex 用量能计入这部分预算,意味着对一家已经签了 EDP 的公司来说,用 Codex 几乎是「不花新钱」。这对 OpenAI 在企业编程市场抢 GitHub Copilot 的份额,是一个非常实在的杠杆。
Copilot 背靠 Azure 与 GitHub,过去在企业渠道几乎没有对手。Codex 通过 Bedrock 切到 AWS 客户的承诺预算里,是直接在 Copilot 的腹地开了一道口子。
Bedrock 上的 Agent 这盘棋
Managed Agents 这块更值得长线观察。AWS 想做的不只是「卖模型 token」,而是把 Agent 的运行时——orchestration、工具调用、状态管理、安全护栏——做成一个托管层。OpenAI 提供推理大脑,AWS 提供企业级的运行躯壳。
这条路线和 Anthropic 力推的 Claude Agent SDK 是直接对位的。区别在于:Anthropic 的方案更偏 SDK + 开发者自由组合;AWS Managed Agents 更偏「全托管、点几下控制台就能上线」,目标客户画像不完全一样。对中后台、客服、内部工具这类场景,托管路线的吸引力更大;对追求灵活度的产品团队,SDK 路线更顺手。
几个还没说清的问题
这次发布也留了一些悬念:
- 限流策略:Bedrock 上 OpenAI 模型的 RPM/TPM 配额怎么算,是否和 OpenAI 一方共享池,AWS 没有给出明确说法。
- 新模型节奏:OpenAI 即将发布的 GPT-5.6 会不会同步上 Bedrock,还是先在 OpenAI 一方独占一段时间,没有时间表。
- 微调能力:目前公告里没有提 fine-tuning 是否开放,Bedrock 上现有的 Anthropic 模型也只有部分支持,这块大概率要等。
- Codex on Bedrock 的实测体验:直连 OpenAI 后端的 Codex 已经在开发者社区有不少口碑数据,走 Bedrock 这条路径延迟和稳定性如何,要等 limited preview 放量才能看清。
写在最后
OpenAI 进 Bedrock,表面上是渠道扩张,里子是云厂商和模型厂商的关系再平衡。Azure 用 OpenAI 独占性换了两年红利,现在 OpenAI 把同样的牌也给了 AWS——这意味着模型厂商不再愿意被任何单一云绑定,云厂商也接受了「自家模型打不赢就代理」这件事。
对开发者来说,结果是好的:选择更多、价格透明、合规路径变短。无论你是已经全套 AWS 的企业团队,还是只想用一个统一接口横跨多家模型的独立开发者,今天能用的工具都比一年前丰富了不止一个数量级。
这场仗远没打完,但至少 Bedrock 的牌桌上,终于摆齐了。
参考来源
- linux.do - AWS Bedrock 上可以用 GPT-5.5 了:社区对此次 AWS 官方公告的转述与讨论
- linux.do - OpenAI 宣布其旗舰大模型和 Codex 已正式上线 AWS 平台:关于 OpenAI 侧公告的中文整理