Claude深夜炸场!Fable 5贵到离谱,强到犯规?

温故智新AIGC实验室

TL;DR:

Anthropic凌晨突然掏出Claude Fable 5,号称“史上最强公开模型”,跑分把GPT-5.5和Gemini 3.1 Pro按在地上摩擦,但价格直接翻倍到每百万输出50美元。一边是行业价格战,一边是AI奢侈品,这波操作你品,你细品。


神话级模型终于“下凡”了

北京时间6月10日凌晨,当大部分程序员刚放下键盘准备睡觉,Anthropic突然甩出一枚深水炸弹——Claude Fable 5。没有预热,没有预告,就这么赤裸裸地发布了。

如果你以为它只是Claude家族又一个平平无奇的新成员,那就太天真了。Fable翻译成中文是“寓言”,但它的内核其实是Mythos-class(神话级)模型。Anthropic自己承认,Fable 5是他们终于敢拿出来给普通开发者和企业使用的公开版Mythos——那个此前被锁在“Project Glasswing”保险柜里的危险品1

为什么说“危险”?今年4月,Anthropic把Mythos预览版只给了AWS、苹果、微软、英伟达等少数安全伙伴,专门用来挖关键软件漏洞。官方直言:Mythos发现过大量高危漏洞,包括操作系统和浏览器里长期没人发现的问题。放在防守者手里是神兵,放在攻击者手里就是“自动漏洞挖掘机”2。所以之前一直不敢开放。

现在,他们终于给这个猛兽套上了护栏——安全分类器,高风险请求直接拒绝,或者回退到较弱的Opus 4.8。然后,把它推向市场。

跑分不讲武德,工程能力断崖式领先

Fable 5的跑分表,可以用四个字形容:不讲武德

  • SWE-Bench Pro:80.3%,碾压Opus 4.8的69.2%,更别说GPT 5.5的58.6%和Gemini 3.1 Pro的54.2%。
  • FrontierCode Diamond:29.3%——这个测试看的是模型能不能写出“维护者愿意接受的代码”。Opus 4.8只有13.4%,GPT 5.5更是可怜到5.7%。已经不是赢几个百分点的问题了,这是代际碾压
  • Terminal-Bench 2.1:88.0%,直接压过OpenAI Codex CLI组合的83.4%3

但真正的恐怖不在于这些数字,而在于它已经像一个能在工程现场干活的模型。你扔给它一个5000万行Ruby代码库的迁移任务,它真的能拆任务、调工具、修错误、把两个月的工作量压缩到一天——Stripe已经用上了4。哪怕有营销成分,也挡不住一个事实:AI编码正在从“辅助写函数”进入“接管工程流程”

对比一下开源阵营的猛将DeepSeek V4-Pro Max:它在GPQA Diamond、LiveCodeBench等传统基准上很能打,甚至接近闭源最强。但一到长任务、复杂工程、工具协同这类“真实世界”场景,Fable 5直接断崖式领先——SWE Pro上80.3%对55.4%,Terminal-Bench上88.0%对67.9%5DeepSeek强在性价比和开源,Fable 5强在最贵最难的工作

一边价格战,一边卖奢侈品,这波操作谁懂?

聊完性能,我们来谈谈那个让人心碎的问题:

Fable 5的官方定价:每百万输入token 10美元,每百万输出token 50美元。对比Opus 4.8的5美元/25美元,直接翻倍1

而它发布的时间点,正好撞上大模型价格战最激烈的时候:

  • DeepSeek V4-Pro:输入0.435美元,输出0.87美元——只有Fable 5的1/23和1/57。
  • 小米MiMo-V2.5-Pro:同样0.435/0.87美元,官方还喊出“最高降幅99%”。
  • Gemini 3.5 Flash:输入1.5美元,输出9美元,Google甚至把AI Ultra订阅从250美元降到200美元6

Fable 5的输入价格比DeepSeek贵约23倍,输出贵约57倍。这个价格足以劝退99%的普通开发者。

但Anthropic的算盘很清楚:它不想让Fable 5去做便宜模型也能做的事情。日常问答、轻量写作、普通代码补全,当然没必要上它。Fable 5卖的是“时间”——大型代码库迁移、长上下文文档分析、复杂企业流程、网络安全防御、科研假设生成。用最扎心的话说:假如你觉得你的时间更值钱,那就上Fable 5吧

这形成了两个很有意思的阵营:DeepSeek、MiMo、Gemini证明强模型会越来越便宜;Anthropic证明顶级、接近生产力核心的模型,反而可能越来越贵,像奢侈品级基础设施。哪个才是未来?谁也说不好。

谁笑了?谁哭了?

Fable 5的压迫感太强,友商们集体难受。

OpenAI很难受——Codex周活虽然超过500万,但Fable 5在agent编码和长任务上打出了存在感,提醒市场Claude依然是复杂工程任务必须认真对待的对手。

Google也很难受——Gemini体系生态强大,但在这张跑分图里,Gemini 3.1 Pro多项测试都输了。优势在生态和分发,但尖刀能力被Anthropic拿捏了。

国产模型同样要重新回答一个问题:便宜之外,能不能让用户把最难的任务交给你?DeepSeek的1M上下文和极低价格很有杀伤力,但Fable 5的存在提醒市场:便宜模型能覆盖大量任务,可最难的5%或10%,可能还是被最贵的模型拿走

Fable 5的真正市场意义在于:它不会让所有企业马上换模型,但它把竞争推向了一个新维度——未来市场会同时需要两类模型:一类是便宜、稳定、可大规模调用的“工作牛马”;另一类是昂贵、强悍、带着护栏、专门处理高价值任务的“顶级工具”。

最后,一个不得不提的隐患

Fable 5还有一个麻烦点:在网络安全、生物等敏感问题上会自动触发安全审查。有些问题它会直接拒绝,有些会回退到Opus 4.8来回答。对普通用户来说,可能是“问着问着被拒了”;对企业来说,这会变成工程问题——你设计的工作流里,模型突然“降级”了怎么办?

再加上30天数据保留、不支持zero data retention等限制,金融、医疗、法律等行业的采购决策没那么简单。

Anthropic在用Fable 5告诉整个行业:我们不参与每一场价格战,但我们卖的就是最有价值的部分。模型越强,问题越现实——卖给谁?卖多贵?出了事谁负责?这些过去看似遥远的问题,现在已经被摆到了桌面上。


  1. Anthropic 發佈Claude Fable 5 首款Mythos 級AI 模型·Yahoo新聞(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎

  2. Claude深夜炸场,放出史上最强“危险级”模型Fable 5,价格逆天·雷科技(2026/6/10)·检索日期2026/6/10 ↩︎

  3. Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5·36氪(2026/6/10)·检索日期2026/6/10 ↩︎

  4. Claude Fable 5 压迫感太强,友商的日子都不好过了·雷科技(2026/6/10)·检索日期2026/6/10 ↩︎

  5. 2026 大模型API 价格一览:GPT-5/Claude 4.6/Gemini 3/DeepSeek V3 费率实测对比·AtomGit开源社区(2026/6/10)·检索日期2026/6/10 ↩︎

  6. 现在好用的 AI 大模型,到底有哪些?怎么收费?一文整理清楚·腾讯云开发者社区(2026/6/10)·检索日期2026/6/10 ↩︎