Claude最强模型“神话”上线,但只给你看“寓言”?Anthropic这波分层操作太骚了

温故智新AIGC实验室

TL;DR

Anthropic终于把自家最强的Mythos级模型端出来了,但普通用户只能拿到“阉割版”Fable 5——同一个底层模型,被装进更严的安全壳里。跑分屠榜、能玩宝可梦、能自主搞科研,但高风险的活儿一触发就自动降级到老模型。这波分层发售,说白了就是:“我的AI太强了,怕你乱用,先给你个家长监护模式。”

凌晨,Anthropic悄悄把Claude家族的天花板捅破了——不是发布一个模型,而是俩:Claude Fable 5Claude Mythos 5。一个面向所有人,一个只对“受信任的安全合作伙伴”开放。但人家说了,这俩其实是同一个底层模型,只是Fable 5被“穿上了安全裤”。1

这命名,也很Anthropic。从Haiku(俳句)到Sonnet(十四行诗)到Opus(巨著),一直在文学艺术里打转。这回直接膨胀到了“Mythos”(神话)——而给普通人的版本叫“Fable”(寓言)。说白了就是:神话太危险,你们还是听寓言吧。

同一个妈,不同的娃

按照官方说法,Fable 5 和 Mythos 5 共享同一套“大脑”,但Fable 5多了三道安全分类器。一旦你问的问题涉及网络安全、生物、化学、模型蒸馏这些敏感领域,Fable 5立刻怂了,自动把活儿甩给上一代Opus 4.8来干。2

翻译成人话:你想让它写个恶意软件?门都没有。它会跟你说“这事儿我大哥来处理”——然后大哥来了个4.8版本,能力差一截。

而Mythos 5呢?在这些领域基本“解禁”。Project Glasswing里的网络安全伙伴可以用满血版,未来部分生命科学研究者也能拿到解除生物化学限制的版本。3

贵到肝疼,但能力真能打

先聊钱:Fable 5定价是输入10美元/百万token,输出50美元/百万token。正好是Opus 4.8的两倍,和Opus 4.8的fast mode一样贵。Anthropic还补了一句:不到之前Mythos Preview价格的一半——但Mythos Preview从未公开卖过,这话没法验证。4

更扎心的是:6月23日以后,即使用户订阅了Claude Pro/Max,Fable 5也可能不包含在基础包里了,要按量收费。这公司越来越抠了,不过好歹给了半个月免费试用期。5

但能力确实能打。在SWE-Bench Pro上干到80.3%,把Opus 4.8的69.2%和GPT-5.5的58.6%甩开一截;在更难的FrontierCode Diamond上拿到29.3%,Opus只有13.4%,GPT-5.5更是只有可怜的5.7%。6

视觉能力也离谱——以前Claude想玩《宝可梦 火红》得装一堆外挂工具,Fable 5直接靠视觉输入就能通关,真·凭眼神玩游戏。7

从写代码到搞科研,全能ACE

官方展示了几个demo,一个比一个秀:

  • 写了个太阳系模拟器,从物理第一性原理推导行星轨道,还能预测日食。
  • 自主玩《异星工厂》这种工厂自动化游戏,规划生产线、搭建物流系统。
  • 先自己写了个浏览器CAD编辑器,然后用这个编辑器设计了一个可3D打印的模型——工具和自我使用,闭环了。
  • 最后还编了个流体模拟,配上自己生成的古典音乐EDM remix,艺术和代码双开花。8

但真正炸裂的是Mythos 5的科研能力。Anthropic称,在蛋白设计任务中,Mythos 5能把部分环节加速约10倍。它独自完成了14个蛋白靶点的研究,9个产生了强候选分子。在一项基因组学研究中,它自主整理了138种动物的数百万个单细胞数据,训练出的模型甚至超过了最近《Science》上发表的模型,规模只有后者的百分之一。9

也就是说,Mythos 5的能力已经逼近“科研Agent”——能读问题、用工具、训练模型、提出假设,再到发表论文的程度。

为什么非要分层?

以前的模型发布:参数、跑分、价格、API名,简单粗暴。但到了Mythos这儿,事情变复杂了——同一个底层模型,硬生生切出两个版本,还给上了不同权限。

原因很简单:它太强了,强到不敢随便给人用。

Mythos 5在网络安全上能发现藏了27年的远程崩溃漏洞,在生物化学上能自主设计蛋白——这些能力双刃剑的属性太明显。Anthropic不得不采用“受信任访问”模式,只把满血版交给审核过的安全研究者和科学家。10

这场面,像极了科幻电影里科学家造出超级AI后,先锁在保险柜里,只给少数人发钥匙。

有意思的是,这种“分层发售”可能会成为行业新趋势。未来谁要证明自己的模型强,可能也得学Anthropic:先出个“公开版”,再搞个“专家版”。模型能力不再只有高低之分,还多了“权限”这个维度。

普通用户到底亏不亏?

说实话,对绝大多数写代码、做分析、写文章的用户来说,Fable 5已经足够强了。官方数据显示,超过95%的会话不会触发安全护栏降级。11 也就是说,你日常使用基本就是Mythos 5的体验。

但如果你真想拿它去搞点“危险”的事——比如挖漏洞、设计药物——对不起,你得先通过Anthropic的信任审核。而且就算通过了,Mythos 5的所有流量会被强制保留30天,方便审计。12

这大概就是最强的代价:能力越大,监管越严。Anthropic先替我们把边界画好了——我们只管在安全区里玩得开心就行。

最后说一句

Fable 5是能玩《神鬼寓言》的AI(Fable也是一款经典RPG游戏),Mythos 5是能创造“神话”的AI。一个叫寓言,一个叫神话,这名字就差把“你只能听故事,不能成神”写脸上了。

但不管怎样,我们终于离那个“AI什么都能干”的下一步,又近了一点点——只是Anthropic在前面加了些围栏。