Claude Fable 5:最强AI变身“Token刺客”,普通人的免费午餐要结束了?

温故智新AIGC实验室

TL;DR:

Anthropic 刚扔出王炸:Claude Fable 5 跑分屠榜、代码迁移强到离谱,但别高兴太早——这货6月23日后就不包在月卡里了,每百万输出token烧你50刀。以前一张票玩全场?不存在的。最强AI正在变成按量计费的“奢侈品”,普通用户和巨头的起跑线,又被悄悄往后拽了一把。


开门见山:史上最强AI,但普通人慎点

对普通人最坏的消息要来了。

就在刚刚,Anthropic 正式推出 Claude Fable 5 和 Claude Mythos 5。前者是首个面向公众开放的 Mythos 级模型1,后者则只给少数网络安全防御机构和关键基础设施合作方2。乍一看,这是“最强AI普惠”的大喜事,但你仔细读完价格表和订阅规则——笑容逐渐凝固。

简单说:一张月卡解锁最强 AI 的黄金时代,可能从6月23日起正式成为历史。

是的,Anthropic 说了,从现在到6月22日,Fable 5 会包含在 Pro、Max、Team 等订阅计划里,不额外收费。但到了6月23日,它就会被移出,继续用就得消耗 usage credits3欢迎进入 Token 计费时代,朋友。


它强到什么程度?跑分屠榜,还能一个人打《宝可梦》

先别急着哭,咱们看看这个模型到底有多猛。

Anthropic 官方博客上的基准测试图就是一个词:遥遥领先4。软件工程、知识工作、视觉理解、科学研究,每一项都把之前的 Opus 4.8 甩开一大截。最离谱的案例来自 Stripe:一个 5000 万行 Ruby 代码库的迁移任务,人类工程团队需要两个多月,Fable 5 一天搞定。5

Cognition 的 FrontierCode 测试也显示它在中等算力消耗下拿到了最高分,而且 token 效率还比以前高——注意,这话听听得了,每次新模型发布都这么说,结果个个都变成了“Token刺客”。6

知识工作方面,Hebbia 金融基准测试第一,IMC 交易分析评测也表现出色。视觉能力更绝:它能从复杂科学图表里抠出精确数字,还能根据网页截图重建应用源码。Anthropic 还放了一段演示——Fable 5 只靠游戏画面就打通了《宝可梦火红》,没有地图、没有导航、没有额外辅助,就是纯视觉推理。7

长上下文和记忆能力也进化了。在《杀戮尖塔》测试中,给模型提供持久化文件记忆后,它的表现提升幅度是 Opus 4.8 的三倍,进入最终章节的频率也是三倍。8

最让人后背发凉的是生命科学方向。内部的蛋白质设计专家用 Mythos 5,药物设计流程加速约 10 倍。在一个案例里,Mythos 5 在无人协助下独立完成了从选择结合位点到调用设计工具再到处理失败结果的整条流程,14 个蛋白靶点里 9 个产生了值得继续研究的候选方案。9

你以为这是AI?这他妈是个7x24小时不睡觉的博士后。


实测:它终于数清了6根手指

比官方博客更直观的是实测。

我亲自试了试:Fable 5 已经能准确识别图像里6根手指了——AI 界的“世纪难题”终于被攻克!10 又拿全国高考一卷作文题让它写,文风流畅,不“普通”,甚至有点漂亮。

@Hypergent 的实测更惊艳:让它做小行星可视化任务,它不光提取数据,还设计了包含轨道轨迹和悬停详情的交互式展示;让它在浏览器 CAD 编辑器里设计一个完整的可3D打印模型,编辑器本身也是它写的11。健身度假村规划任务里,它借助 GPT-Image-2 和 Nano Banana 生成符合实际使用逻辑的场地方案,考虑区域连接、功能分布、人流动线——比很多设计师想的还周到。

沃顿商学院教授 Ethan Mollick 的评测最有料。他让 Fable 5 构建一个基于真实交通数据的等时线地图,模型调用多个 Agent 收集航班、铁路、道路数据,同时完成代码编写和测试,不断反馈修正。12 更夸张的是,他让 Fable 5 开发一款名为 Concord 的研究工具——模型先生成19页设计文档,又连续工作9个半小时,最终开发出用于分析开放式研究数据的完整软件。

不过,Mollick 也说了大实话:Fable 5 仍然会出错,需要人工检查;而且长任务烧 token 简直像开闸放水。 13 我作为 Pro 用户(20刀一个月),简单跑了几个任务就额度用光——这哪是消费AI,这是在给 Anthropic 送钱。


安全护栏:你以为它啥都能干?天真

因为能力太强,Anthropic 给 Fable 5 装了三层安全分类器14。只要请求涉及网络安全、生物、化学或模型蒸馏等高风险方向,系统自动切换到 Claude Opus 4.8 响应,并告知你“换人了”。早期数据里超过95%的会话不会触发,但一旦进入高风险区域,你就只能用“阉割版”。

网络安全是限制最严的方向——Mythos 级模型擅长发现和利用软件漏洞,还能代理式攻击。为了避免被滥用,Fable 5 的网络安全分类器覆盖面很广。生物和化学方向也类似,暂时大多数相关请求都会回退到 Opus 4.8。

更有意思的是,Anthropic 还加了一层“隐藏保护”——不提示用户,直接通过提示词修改、steering vectors 等方式降低模型在协助训练其他前沿模型方面的能力。已经有受害者现身说法了。15

一句话:强是强,但你想用它搞点“大事”?门都没有。


Token刺客的真相:订阅制时代的终结

好了,聊完技术,咱们该算账了。

Fable 5 和 Mythos 5 的定价:每百万输入 token 10 美元,每百万输出 token 50 美元16。比 Claude Mythos Preview 便宜一半,但对比 Opus 4.8 贵了不少。而且长任务消耗的 token 量非常恐怖——Mollick 那个等时线地图项目,token 账单估计能让你肉疼。

更关键的是订阅规则的变化。过去用户付一笔不算贵的月费,就能在很大程度上享用世界上最强的一批智能。订阅制模糊了真实成本,也让普通个体在某些时刻和巨头站上了同一条起跑线。Token 计费降临之后,一切都会发生变化。

AI 会从一种近似包月服务,变成一种按量消耗的生产资料。 最强模型也正在变成一种更昂贵、更精细计价的生产工具。

有些人可以不太在乎成本——让 Fable 5 执行24小时长链任务,重构5000万行代码,独立开发完整应用。但更多普通用户会在每次调用前下意识地掂量:这个问题值不值得花 token?这个任务值不值得交给最强模型?这次尝试失败后,还要不要继续让它重来一遍?

最糟糕的消息莫过于此。AI 没有变弱。相反,它正以前所未有的速度变强,强到足以独立完成越来越多原本属于人类的脑力工作。与此同时,获得这种能力的门票正在不断提高。 普通人与先进生产力之间,刚刚被大模型拉近的信息差,可能会因为昂贵的 token 计费重新拉开。

Anthropic 如此,未来 OpenAI 等其它厂商也很难例外。前沿模型越强,训练和推理成本越高,尤其是这两家 AI 公司目前都在争取上市,都需要向资本市场证明自己不只是能训练更强模型,也能把模型能力变成持续收入。17

因此,与其说 Fable 5 的发布是一次模型升级,倒不如说是一次彻底调整 AI 订阅体系的预热。如果 AI 的普惠窗口期开始进入倒计时,那这绝对不会是最好的消息。

当然,你可以趁着6月22日之前赶紧薅一波羊毛——毕竟,有便宜不占是那什么。但别忘了,往后每一次调用前,你都得先摸摸自己的钱包。

欢迎来到 Token 刺客的时代。


引用


  1. Anthropic深夜发布Claude Fable 5/Mythos 5,屠榜所有基准测试·凤凰网·2026/6/10·检索日期2026/6/10 ↩︎

  2. 知名科技记者爆料:Anthropic明天将发布“公开版本Mythos”·搜狐网·2026/6/9·检索日期2026/6/10 ↩︎

  3. 同上,定价与订阅规则部分。 ↩︎

  4. Anthropic官方博客基准测试图(来自RSS内容片段)。 ↩︎

  5. Stripe测试案例(来自RSS内容片段)。 ↩︎

  6. Cognition FrontierCode测试结果(来自RSS内容片段)。 ↩︎

  7. 宝可梦火红演示(来自RSS内容片段)。 ↩︎

  8. 《杀戮尖塔》测试(来自RSS内容片段)。 ↩︎

  9. 蛋白质设计案例(来自RSS内容片段)。 ↩︎

  10. 六根手指识别测试(来自RSS内容片段)。 ↩︎

  11. @Hypergent 实测(来自RSS内容片段)。 ↩︎

  12. Ethan Mollick 等时线地图项目(来自RSS内容片段)。 ↩︎

  13. Ethan Mollick 评价(来自RSS内容片段)。 ↩︎

  14. 安全分类器说明(来自RSS内容片段)。 ↩︎

  15. 隐藏保护与受害者现身说法(来自RSS内容片段)。 ↩︎

  16. 定价数据(来自Google搜索内容与RSS内容片段)。 ↩︎

  17. 上市压力分析(来自RSS内容片段最后一段的推论)。 ↩︎