Anthropic搞了个“双面间谍”：最强AI Claude Fable 5公开，但专家版只给“自己人”开小灶

TL;DR：

Anthropic终于把“神话级”AI Claude Fable 5端给了大众，但又怕它太强惹祸，偷偷给它装了个“安全阀门”——遇到敏感问题就自动切到弱一点的模型来答。另一个无限制版Mythos 5，只给经过审核的专家和合作伙伴用，堪称AI界的“VIP小黑屋”。

“神话级”AI真的下山了，但带着镣铐

如果你觉得现在的AI已经够卷了，那Anthropic这次的操作直接让天花板又往上顶了三米。

北京时间6月10日（美国当地时间6月9日），Anthropic正式发布了内部评级为 “Mythos级” 的旗舰模型——Claude Fable 5。同时还端出了一个“孪生兄弟”Claude Mythos 5。俩模型共享同一个底层大脑，但待遇天差地别：Fable 5面向所有人开放，Mythos 5只给经过审核的合作方。¹

为啥要搞双版本？简单说：Fable 5太强了，强到让人害怕。

Anthropic给它装了一套新的安全防护系统——一个“安全分类器”。当你问它“怎么搞网络攻击”或者“怎么合成危险化学品”时，分类器会立刻拦截，然后悄悄把问题转交给一个稍弱但同样能打的Claude Opus 4.8来回答。相当于给超级赛车装了个限速器，平时随便飚，但遇到危险路段就自动降速。¹

数据表明，超过95%的日常会话根本不会触发这个分类器。也就是说，你写代码、写文案、做分析时，Fable 5还是那个满血版的自己。²

性能“开挂”：一天干完团队两个月的活

抛开安全防护不谈，Fable 5的能力到底有多猛？一句话：它能干“独立施工”的活儿了。

支付巨头Stripe在一个包含5000万行Ruby代码的庞大代码库里测试了Fable 5。结果模型在一天之内，独立完成了一项整个团队手动操作需要耗时两个多月的代码库迁移工作。¹

基准测试的数据更是直白：

SWE-bench Pro（衡量困难软件工程任务）：Fable 5 达到 80.3%，而GPT-5.5只有约58–60%，Claude Opus 4.8约50–55%。²
FrontierCode Diamond（高质量可维护的智能体编码）：Fable 5 得分 29.3%，Opus 4.8是13.4%，GPT-5.5仅5.7%。²

新加入Anthropic的顶尖AI研究员安德烈·卡帕西（对，就是那个从OpenAI跳槽的大神）评价说：“当你给它一个真正困难、需要长时间琢磨的任务时，模型像是真的‘懂了’，然后闷头就去执行。那种想让人彻底不看代码、放手让它干的感觉，以前从来没有这么强烈过。”他还不忘补一句：“生产环境里可别真这么干。”²

不只是码农神器：视觉+科学双双“破圈”

Fable 5的视觉能力也升级了。它不光能描述图片，还能看懂图表里的精确数据，甚至根据一张截图就重建出整个网页的源代码。Anthropic内部做了两个有趣的测试：让Fable 5玩《宝可梦·火红》，仅靠纯视觉框架盯着原始游戏截图，一路通关；玩《杀戮尖塔》时，通过持久记忆能力，到达最终幕的几率提高了三倍。¹

不过，真正的核弹级应用在科学领域。在不受安全防护限制的 Mythos 5 上，Anthropic内部的蛋白质设计专家用它加速药物设计流程约十倍。在基因组学方面，Mythos 5在超过一周的自主工作中完成了一项新研究：梳理了138个动物物种、数百万个细胞的单细胞数据，自己设计并训练了一个机器学习模型，效果超过了近期发表在《科学》上的模型，规模却小了100倍。¹

当然，这么强的能力也意味着双刃剑。Anthropic测试发现，Mythos 5仅凭生物学推理，就能在腺相关病毒（AAV）设计上超过专门训练的模型——AAV可用于基因治疗，但也能用来设计危险病毒。²

价格砍半，但争议没少

两款新模型的定价为：每百万输入token 10美元，每百万输出token 50美元。不到此前Mythos预览版价格的一半，但仍然是全球最贵的AI模型之一。¹

对于订阅用户，Anthropic玩了个“限时免费”套路：6月9日到6月22日，Fable 5免费包含在Pro、Max、Team等计划中，之后就要扣额度了。意图很明显——先让你爽两周，然后乖乖掏钱。²

不过，在一片叫好声中，也有冷静甚至尖锐的声音。知名投资人、A16Z普通合伙人阿尼什·阿查里亚指出，Anthropic这次刻意用Fable和Mythos这样的品牌名来压住模型编号，因为“用户不在乎第几代，只想知道是不是最前沿”。¹

开源模型研究员内森·兰伯特则毫不客气地吐槽：“Anthropic成天把安全挂在嘴边，但连社交平台上那帮懂技术的人都看得出来，这不过是给产品做安全包装。”¹

“玻璃翼计划”：200家机构组成的安全圈

Mythos 5不对外开放，目前只通过“玻璃翼计划”向审核通过的合作伙伴提供。这个计划今年4月启动时约有50家机构，包括亚马逊AWS、苹果、谷歌、微软、英伟达等巨头。6月2日又新增了约150家，覆盖电力、水务、医疗、通信等关键基础设施领域，总数达到约200家。¹

如果你是开源项目维护者，仓库有5000以上GitHub星标，也可以通过“Claude for Open Source”程序单独申请。²

写在最后

Claude Fable 5的发布，标志着AI公司终于开始认真思考“能力与责任”的平衡问题。它既不是把强能力完全锁死，也不是放任自流，而是用一套精细的“分级授权”机制来管理风险。这种模式很可能会成为未来前沿AI发布的“标准操作”。

不过话说回来，当模型强到需要用一个“稍弱的模型”来回答危险问题时，这本身就已经说明了一个事实：我们离AGI，可能比想象中更近，也更危险。

“神话级”AI走向大众，但Anthropic给它装了个安全阀门·36氪·作者苏扬（2026/6/10）·检索日期2026/6/10 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Claude Fable 5 横空出世：最强AI模型首次向公众开放·掘金（2026/6/10）·检索日期2026/6/10 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎