Claude深夜炸场！Fable 5贵到离谱，强到犯规？

TL;DR：

Anthropic凌晨突然掏出Claude Fable 5，号称“史上最强公开模型”，跑分把GPT-5.5和Gemini 3.1 Pro按在地上摩擦，但价格直接翻倍到每百万输出50美元。一边是行业价格战，一边是AI奢侈品，这波操作你品，你细品。

神话级模型终于“下凡”了

北京时间6月10日凌晨，当大部分程序员刚放下键盘准备睡觉，Anthropic突然甩出一枚深水炸弹——Claude Fable 5。没有预热，没有预告，就这么赤裸裸地发布了。

如果你以为它只是Claude家族又一个平平无奇的新成员，那就太天真了。Fable翻译成中文是“寓言”，但它的内核其实是Mythos-class（神话级）模型。Anthropic自己承认，Fable 5是他们终于敢拿出来给普通开发者和企业使用的公开版Mythos——那个此前被锁在“Project Glasswing”保险柜里的危险品¹。

为什么说“危险”？今年4月，Anthropic把Mythos预览版只给了AWS、苹果、微软、英伟达等少数安全伙伴，专门用来挖关键软件漏洞。官方直言：Mythos发现过大量高危漏洞，包括操作系统和浏览器里长期没人发现的问题。放在防守者手里是神兵，放在攻击者手里就是“自动漏洞挖掘机”²。所以之前一直不敢开放。

现在，他们终于给这个猛兽套上了护栏——安全分类器，高风险请求直接拒绝，或者回退到较弱的Opus 4.8。然后，把它推向市场。

跑分不讲武德，工程能力断崖式领先

Fable 5的跑分表，可以用四个字形容：不讲武德。

SWE-Bench Pro：80.3%，碾压Opus 4.8的69.2%，更别说GPT 5.5的58.6%和Gemini 3.1 Pro的54.2%。
FrontierCode Diamond：29.3%——这个测试看的是模型能不能写出“维护者愿意接受的代码”。Opus 4.8只有13.4%，GPT 5.5更是可怜到5.7%。已经不是赢几个百分点的问题了，这是代际碾压。
Terminal-Bench 2.1：88.0%，直接压过OpenAI Codex CLI组合的83.4%³。

但真正的恐怖不在于这些数字，而在于它已经像一个能在工程现场干活的模型。你扔给它一个5000万行Ruby代码库的迁移任务，它真的能拆任务、调工具、修错误、把两个月的工作量压缩到一天——Stripe已经用上了⁴。哪怕有营销成分，也挡不住一个事实：AI编码正在从“辅助写函数”进入“接管工程流程”。

对比一下开源阵营的猛将DeepSeek V4-Pro Max：它在GPQA Diamond、LiveCodeBench等传统基准上很能打，甚至接近闭源最强。但一到长任务、复杂工程、工具协同这类“真实世界”场景，Fable 5直接断崖式领先——SWE Pro上80.3%对55.4%，Terminal-Bench上88.0%对67.9%⁵。DeepSeek强在性价比和开源，Fable 5强在最贵最难的工作。

一边价格战，一边卖奢侈品，这波操作谁懂？

聊完性能，我们来谈谈那个让人心碎的问题：钱。

Fable 5的官方定价：每百万输入token 10美元，每百万输出token 50美元。对比Opus 4.8的5美元/25美元，直接翻倍¹。

而它发布的时间点，正好撞上大模型价格战最激烈的时候：

DeepSeek V4-Pro：输入0.435美元，输出0.87美元——只有Fable 5的1/23和1/57。
小米MiMo-V2.5-Pro：同样0.435/0.87美元，官方还喊出“最高降幅99%”。
Gemini 3.5 Flash：输入1.5美元，输出9美元，Google甚至把AI Ultra订阅从250美元降到200美元⁶。

Fable 5的输入价格比DeepSeek贵约23倍，输出贵约57倍。这个价格足以劝退99%的普通开发者。

但Anthropic的算盘很清楚：它不想让Fable 5去做便宜模型也能做的事情。日常问答、轻量写作、普通代码补全，当然没必要上它。Fable 5卖的是“时间”——大型代码库迁移、长上下文文档分析、复杂企业流程、网络安全防御、科研假设生成。用最扎心的话说：假如你觉得你的时间更值钱，那就上Fable 5吧。

这形成了两个很有意思的阵营：DeepSeek、MiMo、Gemini证明强模型会越来越便宜；Anthropic证明顶级、接近生产力核心的模型，反而可能越来越贵，像奢侈品级基础设施。哪个才是未来？谁也说不好。

谁笑了？谁哭了？

Fable 5的压迫感太强，友商们集体难受。

OpenAI很难受——Codex周活虽然超过500万，但Fable 5在agent编码和长任务上打出了存在感，提醒市场Claude依然是复杂工程任务必须认真对待的对手。

Google也很难受——Gemini体系生态强大，但在这张跑分图里，Gemini 3.1 Pro多项测试都输了。优势在生态和分发，但尖刀能力被Anthropic拿捏了。

国产模型同样要重新回答一个问题：便宜之外，能不能让用户把最难的任务交给你？DeepSeek的1M上下文和极低价格很有杀伤力，但Fable 5的存在提醒市场：便宜模型能覆盖大量任务，可最难的5%或10%，可能还是被最贵的模型拿走。

Fable 5的真正市场意义在于：它不会让所有企业马上换模型，但它把竞争推向了一个新维度——未来市场会同时需要两类模型：一类是便宜、稳定、可大规模调用的“工作牛马”；另一类是昂贵、强悍、带着护栏、专门处理高价值任务的“顶级工具”。

最后，一个不得不提的隐患

Fable 5还有一个麻烦点：在网络安全、生物等敏感问题上会自动触发安全审查。有些问题它会直接拒绝，有些会回退到Opus 4.8来回答。对普通用户来说，可能是“问着问着被拒了”；对企业来说，这会变成工程问题——你设计的工作流里，模型突然“降级”了怎么办？

再加上30天数据保留、不支持zero data retention等限制，金融、医疗、法律等行业的采购决策没那么简单。

Anthropic在用Fable 5告诉整个行业：我们不参与每一场价格战，但我们卖的就是最有价值的部分。模型越强，问题越现实——卖给谁？卖多贵？出了事谁负责？这些过去看似遥远的问题，现在已经被摆到了桌面上。

Anthropic 發佈Claude Fable 5 首款Mythos 級AI 模型·Yahoo新聞(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎
Claude深夜炸场，放出史上最强“危险级”模型Fable 5，价格逆天·雷科技(2026/6/10)·检索日期2026/6/10 ↩︎
Claude「最香」模型发布，速度翻倍价格大砍，编程能力直逼 GPT-5·36氪(2026/6/10)·检索日期2026/6/10 ↩︎
Claude Fable 5 压迫感太强，友商的日子都不好过了·雷科技(2026/6/10)·检索日期2026/6/10 ↩︎
2026 大模型API 价格一览：GPT-5/Claude 4.6/Gemini 3/DeepSeek V3 费率实测对比·AtomGit开源社区(2026/6/10)·检索日期2026/6/10 ↩︎
现在好用的 AI 大模型，到底有哪些？怎么收费？一文整理清楚·腾讯云开发者社区(2026/6/10)·检索日期2026/6/10 ↩︎