AI卷王玩法:Claude一个月挖出271个Firefox漏洞,有个Bug藏了整整20年

温故智新AIGC实验室

TL;DR:

以前是“AI不懂代码,全是幻觉”,现在是“AI一天,人间一年”。Claude Mythos Preview在短短一个月内,帮Firefox薅出了271个安全漏洞——其中180个是致命级,有的Bug甚至比许多读者的年龄都大。这波“赛博挖矿”,直接把Mozilla干成了历史上最安全的Firefox版本。


兄弟们,今天聊点硬核的。

最近Mozilla发了一篇爆火复盘博文,看完直接让人倒吸一口凉气——那只叫Claude Mythos的AI,在短短一个月内,帮Firefox干掉了423个安全漏洞。你没看错,423个,不是4.23个。1

更离谱的是,这4月份的修复量,比Firefox此前整整15个月加起来的还要多1 降维打击?不,这简直是降维“屠杀”。

真正的“顶级猎手”:从全网笑柄到降维打击

几个月前,AI写的漏洞报告还是开源社区的“噩梦”。

说得好像有模有样,结果全是幻觉(Slop)。维护者花大量时间去验证一个“惊天大发现”,最后发现是个“平平无奇的误会”。那时候大家的态度很统一:AI写代码?行。AI找Bug?别闹了。

但现在,情况彻底变了。

Mozilla工程师的原话是:“突然之间,这些bug变得非常好找。”1

规矩就两条:第一,模型自己变强了;第二,工程师们学会了怎么用好它。这两条曲线一相乘,结果就是一个月423个漏洞的恐怖数据。

最猛的是,这423个漏洞里,有271个是Mythos直接挖出来的。1 其中:

  • 180个被评为“高危”(sec-high)
  • 80个评为“中危”
  • 11个评为“低危”

180个高危漏洞是什么概念?这意味着只要用户正常浏览网页,就有可能被攻击者远程控制。过去这种级别的漏洞,只能靠外部白帽子花几万美金悬赏才能挖到一二,现在Mythos像“秋天扫落叶”一样,一把扫了271个。

更离谱的是,有个HTML <legend>元素的漏洞,已经在代码里躺了15年;还有一个XSLT相关的Bug,蹲了整整20年1

一个Bug比很多打工人的职业生涯还长,Mythos一来,直接被“请”出升天。

“沙箱逃逸”都能挖,这可是2万刀级别的活儿

最让安全圈震动的,不是数量,是质量

Mythos找到了多个“沙箱逃逸”漏洞。不懂没关系,我用人话解释一下:浏览器会把每个网页关在一个“隔离间”(沙箱)里,就算网页有毒,它也跑不出去。而“沙箱逃逸”,就是找到办法从隔离间“越狱”,获得控制整个电脑的权限。

这种漏洞有多难找?连最自动化的模糊测试(Fuzzing)都很难覆盖,是漏洞赏金体系里的“天花板”,Mozilla开出的最高赏金是2万美金一个。1

结果呢?Firefox安全工程师Brian Grinstead无奈表示:“Mythos找到的沙箱逃逸漏洞数量,已经超过了所有人类安全研究员的总和。”1

Mythos是怎么干的?它会自己写一段恶意代码注入沙箱进程,然后让这段代码去攻击浏览器最安全的部分。这需要“创造性思维”和对多进程架构的深度理解——而AI,做到了。

Agentic Harness:不只是模型强,是“工程魔法”

光有模型还不够,得有一套能跑的“流水线”。

早期的AI做静态代码分析,误报率极高,根本没法用。而Mozilla和Anthropic搞出来的这套Agentic Harness,才是真正的“幕后黑手”。1

它的逻辑很简单:发现漏洞 → 动态验证(写测试用例来复现,不能复现的自动淘汰)→ 去重 → 跟踪修复。

一开始,工程师需要手动盯着模型跑,调Prompt。跑通之后,就开始并行化,在多台临时虚拟机上同时扫描。最妙的是,一旦Pipeline搭好,换模型就是改一行代码的事1

从Claude Opus 4.6切换到Mythos Preview,无缝衔接,直接起飞。

这也解释了为什么很多安全专家评价:“真正的杠杆在Harness的工程能力,不只在模型本身。”

100多人连夜加班,AI不是一个人在战斗

这里得泼一盆冷水:AI没在自动修Bug。

每一个被Mythos揪出来的漏洞,都需要一个工程师写补丁,另一个做代码审查。AI写的补丁只能当参考,不能直接上线。

为了接住这波史无前例的“漏洞洪流”,Mozilla出动了超过100名工程师,有人写补丁,有人做审查,有人搭管道,有人管发布……这是Firefox历史上最大规模的安全修复行动。1

你可以理解成:Mythos是个不知疲倦的“哨兵”,它在黑夜里一个人发现了成千上万个敌人。但真正要上阵肉搏、修补城墙的,是那100多个纯人类工程师。

正面对决:Anthropic VS OpenAI,谁才是“赛博警察”?

Firefox的423个漏洞,只是冰山一角。

Anthropic发布了Mythos后,直接祭出了“Project Glasswing”(玻璃翼计划),声称Mythos已经在每一个主流操作系统和浏览器中发现了数千个高危漏洞,甚至包括一个潜伏了27年的漏洞OpenBSD。1

然后,Anthropic做了一个“骚操作”:他们把最强模型亲手关了起来。——不公开,只给经过严格审查的防御者使用。

而OpenAI走了另一条路:尽可能广泛地开放

GPT-5.4-Cyber紧随其后发布,并扩展到数千名个人防御者和数百个安全团队。最新的GPT-5.5-Cyber,在UK AI Security Institute(AISI)的测试中,与Claude Mythos打了个平手,甚至在部分专家级任务上还略有反超2

OpenAI的逻辑很清楚:通过身份验证+分级授权,让尽可能多的“好人”拿到尽可能强的武器。

如今,两家巨头都在拼命建墙。但AI安全能力的扩散速度,可能比他们建墙的速度更快。

最后的思考

Mythos和GPT-5.5-Cyber的出现,标志着一个新时代:AI不再是代码的辅助者,而是代码的“审判者”。

当你还在纠结“AI会不会取代程序员”时,AI已经开始替你检查那些藏了20年的“历史遗留问题”了。

这很好。这很吓人。但这也很酷。

未来已来,只是分布不均——有些Bug,终于等到了它的“克星”。


  1. Mozilla深度复盘博文:Firefox团队凭Claude Mythos一个月修复423个漏洞·新智元·微信公众号·2026年5月20日·检索日期2026年5月20日 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. GPT-5.5 matches Claude Mythos in cyber attack tests, UK AI Security Institute finds·The Decoder·检索日期2026年5月20日 ↩︎