AI界的“神话”真来了!Claude Mythos 5发布:5000万行代码一天改完,还能盲打通关《宝可梦》

温故智新AIGC实验室

TL;DR

Anthropic憋了两个月的“神话”模型终于下凡——Fable 5和Mythos 5双版本登场,代码迁移能力直接让工程团队“下班”,盲打《宝可梦》打到通关,还能自己设计蛋白质进药企管线。但别高兴太早:满血版只给“少数人”,普通用户用Fable 5还得过一道AI安检门,敏感问题秒变“爷爷版”Opus 4.8应战。AI越强,人类越像甲方,这剧本是不是有点眼熟?


开门,放神话:一天干完两个月的活

Anthropic这次玩了个“双黄蛋”——Claude Fable 5Claude Mythos 5,前者是戴着护膝的公开版,后者是“原汁原味”的满血版,只给少数经过背景调查的“信任用户”玩1

先别管那些复杂名词,直接看数字——Stripe的5000万行Ruby代码库里,Fable 5花了一天时间完成全库迁移。这个工作量,一个工程团队手动做要两个月。一天 vs 两个月,这不是卷,这是直接把人按在地上摩擦。

更刺激的还在后面:在SWE-bench Pro编程评测中,Fable 5拿下了80.3%的成绩,把隔壁GPT-5.5(58.6%)甩出好几条街1。Cognition的Frontier Code基准里,它甚至在“中等努力”模式下就登顶——也就是说,这哥们儿还没使劲,已经是最强的了。

打游戏不靠作弊,靠“纯视力”

如果数据太枯燥,那就看Demo——Fable 5开始玩《宝可梦·火红版》了。以前想让AI玩这个游戏,得给它配一套“脚手架”:地图导航、内存读取、辅助脚本,跟教小孩写作业一样麻烦。现在Fable 5直接裸眼盲打,仅凭游戏屏幕截图,自己推理路线、规划策略,硬生生打通关1。没有外挂,没有辅助,纯靠视觉和逻辑,这你受得了吗?

更夸张的是《杀戮尖塔》(Slay the Spire)——加上持久化记忆后,Fable 5的表现直接飙升3倍,到达最终关卡的概率也涨了3倍。说白了,AI现在不仅能干活,还能“记住”自己干过什么,长上下文+持久记忆=Agent能力的底裤级升级。

当AI学会“做科研”,科学家开始慌了

如果说写代码、打游戏还只是“工具人”升级,那Mythos 5在科研领域的表现,就有点让人后背发凉了。

在生物医药领域,满血版Mythos 5完全自主执行了一个生物学家的全部工作流:选择蛋白质结合位点、调度生物信息学工具、甚至自己debug运行失败。结果呢?它设计出的14个蛋白质靶向复合物中,有9个已经进入了实验室的真实药物研发管线1

还有更猛的:在基因组学研究中,Mythos 5自主工作了一周多,拼凑了138个物种的单细胞数据,自己设计训练了一个微型机器学习模型——这个模型体积比传统方法小了100倍,表现却直接击败了前不久刚发表在《Science》上的最新科研成果1

100倍小,却能赢Science论文。这已经不是追赶了,这是改写游戏规则。

安全护栏的新玩法:不是拒绝,是“降级”

这次发布最有意思的地方,不是模型多强,而是Anthropic给最强模型套了个可呼吸的笼子

Fable 5背后挂了一组独立分类器,专门检测三类高危问题:网络安全、生物化学风险、模型蒸馏。一旦触发,模型不会像以前一样冷冰冰地说“抱歉,我无法回答”,而是自动把请求转交给Claude Opus 4.8,并告知用户“你被降级了”1

“你被降级了”——这个新词儿,精准点出了前沿AI正在进入的“权限时代”。普通问题用Mythos级能力,敏感问题秒切“爷爷版”。超过95%的会话不会触发降级,但剩下那不到5%,就是AI公司的底线所在。

代价也不小:分类器调得保守,正常科研(比如研究病毒)可能误伤;所有Fable 5和Mythos 5的流量要被保留30天用于安全监控。想用最强能力?那就交出数据治理的自由。

从“巫师”到“甲方”:人类角色的逆转

率先拿到内测权的沃顿商学院教授Ethan Mollick,写了一篇火出圈的长文2。他让Fable 5做一个“等时圈地图”——就是去查航班、铁路、道路速度,然后整合成可视化地图。Fable 5自己启动多个代理,抓了2200多个航班信息、新干线数据、各国道路速度,9个多小时后直接丢出一个可用的项目。

Mollick教授说了一句很扎心的话:过去我们用AI像巫师念咒,现在用AI像赞助人/甲方——你把一堆复杂需求扔给它,它自己开工作室、调度小团队、校对纠错,最后给你成品,你只需要签字2

他给了一个经典比喻:“以前你跟自由职业者反复沟通,现在你用几美金的Token,瞬间雇佣了一整家好莱坞级别的设计院。”

AI越像承包方,人类越像甲方。这话放在两年前是科幻,放在今天就是产品说明书。


三个你可能想知道的“小事”

  1. 免费窗口期:从今天(6月10日)到6月22日,Pro、Max、Team和企业版用户可以免费用Fable 5。6月23日起,想继续用就得掏钱买usage credits了。API用户不受影响,今天就能调1
  2. 定价砍半:Fable 5和Mythos 5统一定价每百万输入Token 10美元,输出Token 50美元,比预览版便宜一半以上。但注意——它仍然不便宜,“便宜”只是相对自己的上一代1
  3. 泄露的“神话”:其实早在3月,Mythos就因Anthropic的CMS配置错误被泄露了3000份内部文档3。当时大家管它叫“Capybara”,参数规模据传10万亿?但官方一直打马虎眼。现在它终于半公开了——带着镣铐和权杖。

最后说一句

有人欢呼最强模型终于上桌,有人焦虑安全护栏会不会锁死创新,有人在熬夜调参试图追上这条不断狂奔的曲线。但不管怎样,AI正在从“你教它怎么做”变成“它自己琢磨怎么做”

而你,准备好当“甲方”了吗?


  1. Claude Fable 5 & Mythos 5发布公告·Anthropic官网(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. What It Feels Like to Work With Mythos·One Useful Thing·Ethan Mollick(2026/6/10)·检索日期2026/6/10 ↩︎ ↩︎

  3. Claude Mythos 5 Review: Anthropic's 10-Trillion Parameter Model (2026)·Build Fast with AI(2026/6/10)·检索日期2026/6/10 ↩︎