Claude Fable 5 来了:Mythos 走出实验室

Anthropic 今日发布 Claude Fable 5,这是首个对公众开放的 Mythos 级模型,与仅限受控机构使用的 Mythos 5 共享底层架构,但加装了生物、网络安全等双用途领域的安全护栏。
Anthropic 把 Mythos 放出来了,但是阉割版
美国时间 6 月 9 日,Anthropic 发布 Claude Fable 5,这是 Claude 5 系列的第一款公开模型,也是 Mythos 级别第一次走出受控机构、出现在普通开发者面前。
这件事的微妙之处在于:就在几天前,Anthropic 还在公开警告 AI 模型的危险性正在快速逼近某个临界点。然后他们就发布了自己迄今最强的公开模型。这种「一边喊危险一边推产品」的姿态,已经是 Anthropic 的标志性叙事方式——它需要 Mythos 来撑住自己在前沿能力上的位置,同时又必须用 Fable 这个有围栏的版本来兑现「负责任 AI」的人设。

Fable 和 Mythos 到底什么关系
根据 TechCrunch 和多个渠道流出的信息,Claude Fable 5 与 Claude Mythos 5 共享同一个底层模型。区别只有一个:Fable 在生物、化学、网络攻击等「双用途能力」(dual-use capabilities)上加装了显式的安全护栏,输出会被拦截或拒答;Mythos 5 没有这些限制,但只对经过 Anthropic 审批的特定机构开放——通常是政府、国家实验室、特定企业合作方。
换句话说,Anthropic 这次的产品策略是把模型按「访问权限」而不是按「能力高低」分层。这跟 OpenAI 的 GPT-4o / GPT-5 那种纯粹按规格分层、按价格切档的逻辑完全不一样。Anthropic 的逻辑更接近核技术或军用品的出口管制:能力是同一份,能不能用、用到什么程度,看你是谁。
这是个很有意思的拐点。过去两年大家都在卷参数、卷上下文、卷价格,Anthropic 这次卷的是「准入」。这不是产品决策,是政策决策。
能力提升在哪
根据已经拿到内测和 Vertex 上线版本的开发者反馈,Claude Fable 5 在几个方向上的提升是肉眼可见的:
- 长上下文的实际可用性。不是 token 数量上的扩张——Anthropic 早就有 200K——而是在 100K+ 上下文里做多跳推理、跨文档引用、长链条 agent 任务时的稳定性。过去 Opus 在长上下文末端经常出现注意力衰减,Fable 5 在这块明显收紧了。
- 多轮对话的状态保持。在 Claude Code 这种典型的 agent 场景里,模型需要连续十几二十轮维持对项目结构、文件状态、用户意图的认知。Fable 5 在长会话末端的「失忆」和「跑偏」概率显著下降。
- 代码能力。这是 Anthropic 这两代最在意的方向。Fable 5 在复杂重构、跨文件修改、长链路调试上的表现据称已经拉开和 Opus 4.x 的差距。Claude Code 用户已经可以通过
/model claude-fable-5[1m]切换,[1m] 表示百万 token 上下文档位。
但要泼一盆冷水:在涉及生物学、合成化学、网络渗透、漏洞利用这些「敏感」领域,Fable 5 会比 Opus 4.x 更保守、更频繁地拒答。安全研究员、生物信息学研究者、红队工程师可能会觉得这个模型很「难用」——这就是 Mythos 留给受控机构的部分。
价格:传说中是 Opus 的两倍
linux.do 的开发者讨论中提到 Fable 5 的定价大约是 Opus 的两倍。Anthropic 官方还没有给出正式 pricing page 的完整披露,但从 Vertex AI 上线后的 metering 数据反推,大致区间是:
- 输入:约 30 美元 / 百万 token
- 输出:约 150 美元 / 百万 token
如果属实,这就是当前公开 API 里最贵的模型。这个价格段意味着 Fable 5 不会是一个「日常驱动」的模型,它是用来做关键决策、复杂 agent、深度代码任务的——你让它跑 7 天解决一个棘手问题是值的,让它写 README 就是烧钱。
这其实跟 Anthropic 一贯的「让模型自己去干活」的产品哲学是一致的:贵没关系,只要它真的能替代一个工程师小时。
怎么用
如果你已经在 Claude Code 里,切换很简单:
/model claude-fable-5[1m]
方括号里的 1m 表示启用百万 token 上下文档位。Anthropic 这次保留了 200K 和 1M 两个档,按 token 计费时单价不同。
如果你走 API,官方的调用方式没变:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-fable-5",
max_tokens=4096,
messages=[
{"role": "user", "content": "分析这份 50K 行的代码库,找出潜在的并发问题"}
]
)
print(response.content)
对于国内开发者,直连 Anthropic 官方 API 仍然不顺畅。OpenAI Hub 已经在第一时间接入了 claude-fable-5,可以用 OpenAI 兼容格式直接调用:
from openai import OpenAI
client = OpenAI(
base_url="https://api.openai-hub.com/v1",
api_key="your-key"
)
response = client.chat.completions.create(
model="claude-fable-5",
messages=[
{"role": "user", "content": "用 Rust 实现一个支持 MVCC 的小型 KV 存储,给出完整代码和测试"}
],
max_tokens=8192
)
print(response.choices[0].message.content)
好处是不用单独搞海外信用卡、不用配代理,同一个 Key 也能在 GPT、Gemini、DeepSeek 之间切换比对——Fable 5 这种贵模型,做评估时尤其需要横向对比。
「双用途护栏」具体是什么
Anthropic 这次在博文里没有展开细节,但从已公开的 system card 来看,Fable 5 的护栏覆盖几类:
- CBRN 相关:化学、生物、放射、核武器领域的「合成路径级」信息会被拒答。教科书级常识仍然可以问,但只要触及「可执行的合成步骤」就会被截断。
- 网络攻击链:高危漏洞的 PoC 生成、定向钓鱼内容、规模化的 social engineering 模板,会被拒。常规的渗透测试方法学、CTF 题目仍然可以讨论。
- 模型自我外泄:Fable 5 拒绝输出可能被用于推断其底层权重、训练数据细节、护栏 prompt 的信息——这是 Anthropic 这次加得很重的一层。
这套护栏不是简单的关键词拦截,而是据称用了一套基于 Mythos 5 自身的 classifier 模型。讽刺的是,护住 Fable 5 的安全网,本身是一个能力更强的、未受限的 Mythos 5。这种「以子之矛攻子之盾」的设定,是 Anthropic 安全工程团队这几年的招牌玩法。
它会不会被「越狱」
几乎肯定会。任何公开发布的模型在 72 小时内都会被各种 jailbreak prompt 试一遍。Fable 5 的护栏据说是 Anthropic 跑过最严格的对抗测试的——但「最严格」和「不可破」之间隔着整个安全研究社区。
更有意思的问题是:当 Fable 5 被越狱后,输出的内容会不会接近 Mythos 5 的能力?如果会,那么 Anthropic 的「分层准入」策略就出现了漏洞——你不需要审批,只需要一个足够好的 prompt。这也是为什么 Anthropic 这次同步加大了对越狱样本的赏金计划。
对开发者意味着什么
几点比较实际的建议:
- 如果你的产品是 代码 agent、复杂工作流编排、长文档分析,Fable 5 值得严肃评估,特别是你已经在 Opus 4.x 上撞到天花板的话。
- 如果你的场景是 客服、内容生成、简单问答,Fable 5 的性价比很差,继续用 Sonnet 或者 Haiku 级别即可。
- 如果你做 安全研究、生物医药、化学相关,Fable 5 大概率不适合你,可能要回退到 Opus 4.x 或者考虑申请 Mythos 5 的机构访问。
- 如果你做 多模型对比评估,建议尽快接入做基线测试——尤其是它和 GPT 系列、Gemini 系列在 SWE-bench、Terminal-Bench 这类 agentic 评测上的差距。
一个更大的问题
Fable 5 的发布把一个之前只在 AI 安全圈内部讨论的问题摆到了台面上:当模型能力强到一定程度,谁有资格使用它?
过去的答案是「付得起钱的都能用」。Anthropic 这次给出了一个新的答案:「能力是分层的,但分层不靠价格,靠身份」。这是个非常欧盟式、非常监管友好的姿态,也是个非常容易被批评为「精英主义」的姿态。
OpenAI 还没有跟进这套逻辑,xAI 不会跟进,DeepSeek 这类开源派更不会。但只要 Fable 5 和 Mythos 5 的「能力差」被实际验证为显著,监管机构就会开始追问:为什么其他厂商不这么做?
这才是 Claude Fable 5 这次发布的真正看点——它不是又一个更强的模型,它是 Anthropic 在「AI 治理产品化」上的一次实操。而这套实操,未来一两年里很可能会成为整个行业被迫接受的模板。
模型上新这件事,从来没有这么政治过。
参考来源
- linux.do - claude-fable-5 已可在 Claude Code 中使用:开发者社区第一手切换命令与使用反馈
- linux.do - Claude Fable 已在 Vertex 上线讨论:包含价格传闻与早期试用讨论



