就在刚刚,Anthropic 宣布 Claude Fable 5 正式发布。
Fable 可译为「寓言」,源自源自拉丁语 fabula,意为「故事、传说」。
Anthropic 表示,Fable 5 的性能超越了其以往所有公开发布的模型。它在几乎所有 AI 性能测试基准测试中都处于领先水平,在软件工程、知识工作、视觉、科学研究以及许多其他领域都展现出卓越的性能。
此外,Claude 5 Fable 比以往的 Claude 模型更节省 token,在长时运行任务中可以做到处理数百万 token 而不失焦点,并通过自身笔记改进输出。任务越长、越复杂,Fable 5 对于其他模型的优势就越明显。
Karpathy 也在第一时间分享了自己的上手体验,称其是一个「非常令人兴奋」的版本。
「从实际体验来看,这同样是一次配得上『大版本升级』的跃迁式进步。在我看来,它和去年 11 月 Claude 4.5 带来的提升属于同一级别。」
Claude Code 团队的成员表示,Fable 5 会让你有从未感受过的气质:

目前已有不少人发出了真实的使用体验:

不过由于模型性能太强,以及对安全风险的担忧,Anthropic 设计了安全措施,让 Claude 在查询一些问题时,或者认为有人「蒸馏」它的时候由 Claude Opus 4.8 进行响应,约 95% 的对话不会触发模型降级。
此前一直引人关注的「最强前沿模型」Claude Mythos 5,此次也面向一小部分网络安全防御者和基础设施提供商发布了,Mythos 5 将首先通过「Project Glasswing」项目进行部署。
Fable 5 和 Mythos 5 的模型底座相同,相比之下,Mythos 5 去掉了部分安全限制。
两款模型定价均为每百万输入 token 10 美元,每百万输出 token 50 美元,不到 Claude Mythos Preview 价格的一半。但该价格比 Opus 4.8 贵了一倍,比 GPT-5.5 输入贵一倍,输出贵 2/3。
官方表示,从即日起,Claude Fable 5 已在所有渠道开放给用户使用,但 Claude Mythos 5 目前仅限 Glasswing 合作伙伴使用,后续将通过扩展可信访问计划来进一步向外推出。
但需要注意一个时间窗口:从今天起至 6 月 22 日,Pro、Max、Team 以及按席位计费的企业版订阅用户,都可以免费使用 Fable 5,无需额外付费。
可从 6 月 23 日起,Anthropic 就会将 Fable 5 从上述订阅方案中移除。届时,用户如需继续使用,将需要消耗使用额度。如果容量允许,我们会延长免费包含的使用窗口。

当然,Anthropic 也表示,未来,如果「当我们拥有足够容量时,我们的目标是重新将 Fable 5 纳入订阅计划的标准权益中。我们会尽可能快地推进这件事。」
Claude Fable 5 与 Claude Mythos 5 的能力评估
Anthropic 表示,Fable 5 堪称其有史以来最强大的模型,而从下面的跑分表中可以看出,这样的描述并不夸张,它几乎在所有维度都处于「碾压」模式……

在软件工程上,Fable 5 能把原本需要数月完成的工程工作压缩到几天内。在一个拥有 5000 万行代码的 Ruby 代码库中,该模型在一天内完成了一次覆盖整个代码库的迁移,而这如果完全依靠人工,则需要一整个团队耗费两个多月时间。
同时,Fable 5 的 token 使用效率也高于 Claude 系列模型:在 Cognition 的 FrontierCode 评测中,Fable 5 在只采用中等 effort 设置的前提下,获得了最高分。


在知识工作上,Fable 5 在复杂分析任务上表现强劲。在 Hebbia 面向高级推理能力的 Finance Benchmark 中,Fable 5 拿到了所有模型中的最高分,并且在基于文档的推理、图表和表格解读、问题解决等方面都有明显提升。
另外,Fable 5 已成为视觉任务上的新 SOTA 模型,它能从详尽的科学图表中提取精确数值,执行复杂的视觉任务,例如仅凭截图还原 Web 应用的源代码。
它对辅助机制(scaffolding)的依赖也更低:例如,以往的 Claude 模型即便配备了提供额外辅助工具的「外挂」系统,在游玩《宝可梦:火红》(Pokémon FireRed)时仍显吃力;而 Fable 5 仅需极简的纯视觉辅助机制,便成功通关了该游戏。
不仅如此,Anthropic 表示,在记忆与上下文、药物设计、分子生物学、基因组学等领域,Fable 5 也都展现了强大的能力。
Fable 5 能够在长时间运行的任务中处理数百万个 token,并利用自身笔记改进输出。Anthropic 让模型玩卡牌构筑游戏《杀戮尖塔》时,赋予其对持久性文件级内存的访问权限,使其性能比 Opus 4.8 提升了 3 倍。Fable 也更频繁地进入游戏的最终关卡。
利用 Mythos 5,Anthropic 的内部蛋白质设计专家将药物设计流程中某些环节的效率提升了约 10 倍。
Mythos 5 是 Anthropic 首个能够持续提出新颖且令人信服的科学假说的模型。在与 Opus 级模型进行的盲测对比中,该公司科学家约 80% 的情况下更倾向于 Mythos 提出的分子生物学假说,并已将其中数个假说推进到实验验证阶段。
与此同时,Mythos 提出的一个关于大肠杆菌(E. coli)蛋白质新机制的假说,已在另一个独立研究同一课题的实验室的研究中得到了证实。
最近 Anthropic 发布了报告,称大模型自我迭代速度越来越快,甚至呼吁全球暂停 AI 技术的开发。此次 Fable 5 发布时也有相应的限制:你不能用 Fable 5 去开发新的大模型。

「限制 Claude 在针对前沿 LLM 开发请求中的有效性」,这就是他们计划挖更深护城河的方式。
最后,根据传闻,OpenAI 的 GPT-5.6 也将在这周发布。期待 Claude 与 ChatGPT 的新一轮对决。
