那个能挖出27年漏洞的AI终于开放了——但被狠狠“阉割”了一刀

温故智新AIGC实验室

TL;DR:

Anthropic 终于把自家最猛的网络安全模型 Mythos 的“安全版”Fable 5 丢给了大众。之前这玩意儿因为能秒杀零日漏洞、甚至让华尔街大佬紧急开会,被藏着掖着好几个月。现在公开版虽然性能还是顶,但权限被砍了一大截,想用它搞破坏?门都没有。


这大概是AI圈今年最“又爱又怕”的一次发布。

今天(6月9日),Anthropic 正式向公众推出了 Fable 5——没错,就是那个在 4 月份被媒体吹成“网络战核武器”的 Claude Mythos 模型的“文明版”。12

如果你还不认识它,先来补个课:今年 4 月,Anthropic 悄咪咪发布了 Mythos Preview,一个通用大语言模型,但它最恐怖的能力是——自主挖掘并利用“零日漏洞”,效率是前代模型的 10 倍。1 测试期间,它一口气揪出了数千个高危或严重级漏洞,有的代码里藏了 27 年都没人发现(OpenBSD 表示这波很伤)。3

当时 Anthropic 怂了,说“这玩意儿太危险,不能随便给人玩”,只开放给 40 家经过严格审核的合作伙伴,包括亚马逊、苹果、微软、英伟达这些大佬,搞了个叫“玻璃之翼”(Project Glasswing)的项目——名字很好听,本质就是:先让好人用上,别让坏人抢跑14

公开版 Fable 5:被“焊死”了安全护栏

现在公众版终于来了,名字叫 Fable 5。但你别以为能直接拿到那个“能黑进任何系统”的完全体。Anthropic 给它上了三重锁:

  • 网络操作权限大幅降低——公开版在系统层面被砍了权限,干不了以前那些“直捣黄龙”的活。
  • 严格的安全防护措施——具体细节没全公开,但明说了:敏感领域的使用会被限制。
  • 比给合作伙伴的版本弱不少——那 40 家公司的专供版叫“玻璃之翼版”,才是真正的满血版。24

说白了,Anthropic 的逻辑是:我要让你用,但只能当“安保员”,不能当“黑客”。

但它依然是头“怪兽”

别以为公开版就菜了。Anthropic 特别强调,Fable 5 在长周期、多步骤任务上性能有显著提升——也就是说,让它帮你写复杂代码、做多步推理,它比你想象中能打得多。2 毕竟底层还是那个“代码推理能力代际跃升”的 Mythos 系列,只是把它那些过于危险的“零日挖掘”功能给藏起来了。

这波发布背后:一场“AI攻防”的预演

如果你关注过 4 月那波新闻,应该记得当时美国财长和美联储主席紧急召集华尔街高管开会,英国、加拿大的监管机构也连夜开会讨论。3 为什么?因为 Mythos 代表的不是“又一款更强的AI”,而是 AI 正在从根本上改变网络安全的游戏规则

过去我们习惯的“发现漏洞→打补丁”的节奏,在 Mythos 这种模型面前就像拿扫帚追飞机。它一天能挖几百个你没见过的新漏洞,而防守方打补丁的速度可能只有它的十分之一。3 这种情况下,谁先拥有这种能力,谁就掌握了网络空间的主动权。

所以 Anthropic 现在才小心翼翼地分阶段释放,先给“好人”做防御,等大家把城墙修得差不多了,再逐步让大众接触。这种 “先加固,再开放” 的策略,大概会成为未来所有超级 AI 模型的标配流程。

对普通人来说,这意味着什么?

如果你是普通用户,短期内你感受不到 Fable 5 的威力——毕竟公开版被阉割了。但长远看,它意味着 你手机里的 App、你用的云服务、你家的路由器,底层那些藏了二十年的陈年漏洞,很快都会被这些 AI 模型翻出来修掉。好消息是:黑客拿到满血版的门槛极高,至少目前还只能靠“偷”。

坏消息是?Anthropic 的首席科学家杰瑞德·卡普兰已经预言了:这种能力很快会在各大模型之间普及。OpenAI、Google 们手里肯定也在憋类似的大招。3 到那时,网络安全的攻防战会加速百倍。谁先补好最关键的漏洞,谁就能活下去。

结语:一个“玻璃翼”的蝴蝶,扇动了半片互联网

Anthropic 把新项目命名为“玻璃翼”,灵感来自玻璃翼蝶——透明的翅膀让它能藏在树叶间,就像那些深藏在代码中的漏洞,肉眼看不到,但 AI 一眼就能揪出来。3

现在,这只蝴蝶终于扇动了翅膀。Fable 5 的公开,意味着一场新的 AI 安全竞赛正式开始。接下来就看各家怎么在“能力”和“安全”之间走钢丝了——而这场戏,注定精彩到让人屏息。


引用