Grok 4.3 登陆 Bedrock,xAI 终于挤进 AWS 模型货架
6月17日,AWS 宣布 xAI 的 Grok 4.3 正式上架 Amazon Bedrock,xAI 由此成为继 Anthropic、Meta、Mistral、Cohere、OpenAI 之后又一个官方模型供应商。这是马斯克与亚马逊在云端的首次正式握手。
今天(6 月 17 日),AWS 宣布 xAI 的 Grok 4.3 正式登陆 Amazon Bedrock,xAI 由此挂上了"Bedrock 官方模型供应商"的牌子。这件事从今年 5 月就开始传,Business Insider 当时援引知情人士说 AWS 正在和 xAI 谈判,没想到一个多月就落地了。
如果只看新闻通稿,会觉得这不过是又一次"某模型上架某云"的常规操作。但放在 2026 年这个时间点看,事情没那么简单——Bedrock 的模型货架上已经摆了 Anthropic、Meta、Mistral、Cohere、Amazon Nova,以及今年 4 月底刚刚接入的 OpenAI 旗舰模型和 Codex。现在 Grok 也进来了,Bedrock 几乎集齐了一线闭源模型的"七龙珠",只差谷歌 Gemini 还在自家 Vertex AI 上没动窝。
这次上架的到底是什么
Grok 4.3 是 xAI 在 Grok 4 系列之后的小步迭代版本,定位是"通用推理 + Agent 工作流"双修。和年初发布的 Grok 4.1 Fast 那种主打低延迟推理的分支不同,4.3 走的是综合能力路线,上下文窗口、工具调用稳定性、长链路 Agent 任务的完成率都做了优化。在 Google Cloud 的 Vertex AI 上,4.3 的模型 ID 就叫 grok-4.3,4.1 Fast 推理版叫 grok-4.1-fast-reasoning,两条线并行。
AWS 这次给出的定位明确——三个场景:
- 复杂推理:数学、代码、多步逻辑这类需要"想清楚再说"的任务
- Agent 工作流:长任务调度、工具调用、记忆管理
- 企业级生成式应用:客服、文档处理、知识库问答这些走量的活儿
值得注意的是,AWS 在公告里特别提到 Grok 4.3 可以和 Bedrock AgentCore 配合使用。AgentCore 是 AWS 今年主推的 Agent 开发平台,提供智能记忆、网关加速、授权策略、工具发现、可观测性这一整套配套设施。Grok 4.3 进来之后,企业开发者搭 Agent 时又多了一个底层大脑选项。
为什么 xAI 愿意进来,AWS 又为什么收
这里头有几层博弈。
先说 xAI。马斯克这家公司一直被诟病的是"模型不差,但分发渠道太单一"——除了 X(推特)上的原生集成和 xAI 自己的 API,企业市场的渗透非常有限。相比之下,Anthropic 凭借 AWS、GCP 双云分发,企业收入今年已经是百亿美元级别。Grok 想吃企业市场这块蛋糕,绕不开 Bedrock 这种聚合分发平台。AWS 帮 xAI 解决的不光是流量,更是合规——Bedrock 自带的 Guardrails、SOC2、HIPAA 这套合规栈,xAI 自己短期内是搭不起来的。
再看 AWS。去年三季度财报电话会上,Andy Jassy 就放话要把 Bedrock 做成"世界上最大的推理引擎",目标是有朝一日和 EC2 平起平坐。要做到这点,模型货架必须全。4 月份接 OpenAI 那次已经是个标志性动作——之前因为 Anthropic 是 AWS 重金投资的对象,外界普遍认为 OpenAI 不可能上 Bedrock。但商业归商业,OpenAI 模型在 Bedrock 上以预览版形式上线之后,AWS 算是把"中立模型超市"这个人设彻底立稳了。现在再加 Grok,意思很明显:我不站队,谁的模型能赚钱我都卖。
这背后还有个微妙的细节——马斯克和贝索斯的私人关系并不好,SpaceX 和蓝色起源在火箭赛道是直接对手。但商业合作能压过个人恩怨,说明 xAI 现在对企业渠道的需求已经急迫到什么程度。
和 Bedrock 上其他模型怎么打
这是开发者最关心的问题。我把目前 Bedrock 主力模型的分工大致捋一遍:
| 模型 | 强项 | 弱项 | |------|------|------| | Claude 4.x | 代码、长文档、Agent 稳定性 | 价格偏高 | | GPT-5 系列 | 综合推理、多模态 | 上 Bedrock 时间短,配额紧 | | Llama 4 | 开源、可微调、便宜 | 推理上限不如闭源旗舰 | | Mistral Large 3 | 欧洲合规、性价比 | 生态相对小 | | Amazon Nova | 深度集成 AWS 服务 | 模型本身实力中游 | | Grok 4.3 | 实时信息、推理速度、"敢说" | 企业场景验证少 |
Grok 4.3 的差异化点在两个地方。一个是和 X 平台的数据联动——这是别家模型给不了的实时社交语料能力,对舆情、金融、营销类应用是真有用。另一个是 xAI 一直强调的"低限制对齐",在企业内部知识库、安全研究这类场景下,Grok 的拒答率确实低于 Claude 和 GPT,对很多 B 端用户是个加分项。
但要说能不能抢走 Claude 4.x 在 Bedrock 上的代码任务份额?我觉得短期内难。Claude 在 AWS 上跑了快两年,企业的 prompt 工程、评测套件、CI/CD 集成都是围绕 Claude 建的,迁移成本不低。Grok 4.3 更可能的机会是吃增量——那些新启动的项目、那些专门做实时数据分析的场景。
给开发者的实用信息
上架 Bedrock 意味着你可以用熟悉的 AWS SDK 直接调 Grok 4.3,鉴权走 IAM,账单进 AWS 账户,不用再单独申请 xAI 的 API Key。对已经在 AWS 生态里的团队来说,接入成本几乎为零。
如果你不在 AWS 生态、又懒得折腾多家 API Key,OpenAI Hub 这边已经同步支持了 Grok 4.3,用 OpenAI 兼容格式调用,国内直连不用代理:
from openai import OpenAI
client = OpenAI(
base_url=\"https://api.openai-hub.com/v1\",
api_key=\"your-hub-key\"
)
resp = client.chat.completions.create(
model=\"grok-4.3\",
messages=[
{\"role\": \"system\", \"content\": \"You are a senior backend engineer.\"},
{\"role\": \"user\", \"content\": \"用 Go 写一个支持限流和重试的 HTTP 客户端封装。\"}
],
temperature=0.3,
max_tokens=2048
)
print(resp.choices[0].message.content)
如果要做 Agent,建议把 tool_choice 显式指定,Grok 4.3 在工具选择上的 hallucination 比 4.1 改善很多,但默认 auto 模式偶尔还是会跳过工具直接编答案。
流式调用走标准的 SSE:
stream = client.chat.completions.create(
model=\"grok-4.3\",
messages=[{\"role\": \"user\", \"content\": \"解释一下 MoE 架构里 expert 路由的几种实现差异\"}],
stream=True
)
for chunk in stream:
delta = chunk.choices[0].delta.content
if delta:
print(delta, end=\"\", flush=True)
一些没明说但值得关注的事
第一,定价。AWS 公告里没给 Grok 4.3 的具体定价,按惯例会和 xAI 直供的价格对齐,但 Bedrock 通常会有 batch 折扣和 Provisioned Throughput 选项。等正式 GA 后看看,按目前 xAI 直接 API 的价位推算,4.3 在 Bedrock 上大概是输入 3 美元/百万 token、输出 15 美元/百万 token 这个量级,比 Claude Sonnet 4.5 略低。
第二,区域可用性。AWS 公告没明确说哪些 Region 首发,但参考 OpenAI 模型 4 月上架时的节奏,预计先在 us-east-1、us-west-2、eu-west-1 三个核心区开,亚太区域要等下一波。这意味着国内做出海产品的团队,如果要走 AWS 调 Grok 4.3,链路上的延迟还得规划一下。
第三,xAI 的"独家"承诺到底有没有。Anthropic 当年拿 AWS 投资时是有部分独家排他的,但后来也松动了。xAI 这次上 Bedrock,目前看是非排他——Vertex AI 那边 Grok 4.3 早就在了。这对开发者是好事,意味着你可以多云比价。
第四,对 Anthropic 的影响。这是最值得玩味的一点。AWS 重金投了 Anthropic,但今年先后引入 OpenAI 和 xAI,等于亲手把 Bedrock 上 Claude 的护城河填平了一截。Anthropic 在 Bedrock 上的份额会不会下滑?大概率会。但 AWS 显然算过账——Bedrock 作为聚合平台的总盘子做大,比单押 Claude 更划算。
写在最后
Grok 4.3 上 Bedrock 这件事,单看模型本身没有惊喜,4.3 也不是革命性版本。但放到行业格局里,它的信号意义比技术意义更大:闭源模型层的"超市化"已经成定局,未来不会再有"某家云只卖某家模型"的格局。开发者的核心竞争力,正在从"选对模型"转向"组合使用、动态切换"。
这也是为什么聚合型 API 平台越来越吃香——不管是 AWS Bedrock 这种巨头自营的,还是 OpenAI Hub 这种第三方聚合的,本质上都是在帮开发者降低模型切换成本。当 Grok、Claude、GPT、Gemini、DeepSeek 都能用同一个 Key、同一套接口调用的时候,谁家模型更适合当前任务,才是真正值得花时间思考的问题。
参考来源
- OpenAI 模型、Codex 在 AWS 上架 - iThome:今年 4 月 AWS 与 OpenAI 扩大合作、OpenAI 模型首次登陆 Bedrock 的详细报道,是理解本次 Grok 上架背景的重要参照。
