AI卷王玩法：Claude一个月挖出271个Firefox漏洞，有个Bug藏了整整20年

TL;DR：

以前是“AI不懂代码，全是幻觉”，现在是“AI一天，人间一年”。Claude Mythos Preview在短短一个月内，帮Firefox薅出了271个安全漏洞——其中180个是致命级，有的Bug甚至比许多读者的年龄都大。这波“赛博挖矿”，直接把Mozilla干成了历史上最安全的Firefox版本。

兄弟们，今天聊点硬核的。

最近Mozilla发了一篇爆火复盘博文，看完直接让人倒吸一口凉气——那只叫Claude Mythos的AI，在短短一个月内，帮Firefox干掉了423个安全漏洞。你没看错，423个，不是4.23个。¹

更离谱的是，这4月份的修复量，比Firefox此前整整15个月加起来的还要多。¹ 降维打击？不，这简直是降维“屠杀”。

真正的“顶级猎手”：从全网笑柄到降维打击

几个月前，AI写的漏洞报告还是开源社区的“噩梦”。

说得好像有模有样，结果全是幻觉（Slop）。维护者花大量时间去验证一个“惊天大发现”，最后发现是个“平平无奇的误会”。那时候大家的态度很统一：AI写代码？行。AI找Bug？别闹了。

但现在，情况彻底变了。

Mozilla工程师的原话是：“突然之间，这些bug变得非常好找。”¹

规矩就两条：第一，模型自己变强了；第二，工程师们学会了怎么用好它。这两条曲线一相乘，结果就是一个月423个漏洞的恐怖数据。

最猛的是，这423个漏洞里，有271个是Mythos直接挖出来的。¹ 其中：

180个被评为“高危”（sec-high）
80个评为“中危”
11个评为“低危”

180个高危漏洞是什么概念？这意味着只要用户正常浏览网页，就有可能被攻击者远程控制。过去这种级别的漏洞，只能靠外部白帽子花几万美金悬赏才能挖到一二，现在Mythos像“秋天扫落叶”一样，一把扫了271个。

更离谱的是，有个HTML <legend>元素的漏洞，已经在代码里躺了15年；还有一个XSLT相关的Bug，蹲了整整20年。¹

一个Bug比很多打工人的职业生涯还长，Mythos一来，直接被“请”出升天。

“沙箱逃逸”都能挖，这可是2万刀级别的活儿

最让安全圈震动的，不是数量，是质量。

Mythos找到了多个“沙箱逃逸”漏洞。不懂没关系，我用人话解释一下：浏览器会把每个网页关在一个“隔离间”（沙箱）里，就算网页有毒，它也跑不出去。而“沙箱逃逸”，就是找到办法从隔离间“越狱”，获得控制整个电脑的权限。

这种漏洞有多难找？连最自动化的模糊测试（Fuzzing）都很难覆盖，是漏洞赏金体系里的“天花板”，Mozilla开出的最高赏金是2万美金一个。¹

结果呢？Firefox安全工程师Brian Grinstead无奈表示：“Mythos找到的沙箱逃逸漏洞数量，已经超过了所有人类安全研究员的总和。”¹

Mythos是怎么干的？它会自己写一段恶意代码注入沙箱进程，然后让这段代码去攻击浏览器最安全的部分。这需要“创造性思维”和对多进程架构的深度理解——而AI，做到了。

Agentic Harness：不只是模型强，是“工程魔法”

光有模型还不够，得有一套能跑的“流水线”。

早期的AI做静态代码分析，误报率极高，根本没法用。而Mozilla和Anthropic搞出来的这套Agentic Harness，才是真正的“幕后黑手”。¹

它的逻辑很简单：发现漏洞 → 动态验证（写测试用例来复现，不能复现的自动淘汰）→ 去重 → 跟踪修复。

一开始，工程师需要手动盯着模型跑，调Prompt。跑通之后，就开始并行化，在多台临时虚拟机上同时扫描。最妙的是，一旦Pipeline搭好，换模型就是改一行代码的事。¹

从Claude Opus 4.6切换到Mythos Preview，无缝衔接，直接起飞。

这也解释了为什么很多安全专家评价：“真正的杠杆在Harness的工程能力，不只在模型本身。”

100多人连夜加班，AI不是一个人在战斗

这里得泼一盆冷水：AI没在自动修Bug。

每一个被Mythos揪出来的漏洞，都需要一个工程师写补丁，另一个做代码审查。AI写的补丁只能当参考，不能直接上线。

为了接住这波史无前例的“漏洞洪流”，Mozilla出动了超过100名工程师，有人写补丁，有人做审查，有人搭管道，有人管发布……这是Firefox历史上最大规模的安全修复行动。¹

你可以理解成：Mythos是个不知疲倦的“哨兵”，它在黑夜里一个人发现了成千上万个敌人。但真正要上阵肉搏、修补城墙的，是那100多个纯人类工程师。

正面对决：Anthropic VS OpenAI，谁才是“赛博警察”？

Firefox的423个漏洞，只是冰山一角。

Anthropic发布了Mythos后，直接祭出了“Project Glasswing”（玻璃翼计划），声称Mythos已经在每一个主流操作系统和浏览器中发现了数千个高危漏洞，甚至包括一个潜伏了27年的漏洞OpenBSD。¹

然后，Anthropic做了一个“骚操作”：他们把最强模型亲手关了起来。——不公开，只给经过严格审查的防御者使用。

而OpenAI走了另一条路：尽可能广泛地开放。

GPT-5.4-Cyber紧随其后发布，并扩展到数千名个人防御者和数百个安全团队。最新的GPT-5.5-Cyber，在UK AI Security Institute（AISI）的测试中，与Claude Mythos打了个平手，甚至在部分专家级任务上还略有反超。²

OpenAI的逻辑很清楚：通过身份验证+分级授权，让尽可能多的“好人”拿到尽可能强的武器。

如今，两家巨头都在拼命建墙。但AI安全能力的扩散速度，可能比他们建墙的速度更快。

最后的思考

Mythos和GPT-5.5-Cyber的出现，标志着一个新时代：AI不再是代码的辅助者，而是代码的“审判者”。

当你还在纠结“AI会不会取代程序员”时，AI已经开始替你检查那些藏了20年的“历史遗留问题”了。

这很好。这很吓人。但这也很酷。

未来已来，只是分布不均——有些Bug，终于等到了它的“克星”。

Mozilla深度复盘博文：Firefox团队凭Claude Mythos一个月修复423个漏洞·新智元·微信公众号·2026年5月20日·检索日期2026年5月20日 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
GPT-5.5 matches Claude Mythos in cyber attack tests, UK AI Security Institute finds·The Decoder·检索日期2026年5月20日 ↩︎