TL;DR:
以前是“AI不懂代码,全是幻觉”,现在是“AI一天,人间一年”。Claude Mythos Preview在短短一个月内,帮Firefox薅出了271个安全漏洞——其中180个是致命级,有的Bug甚至比许多读者的年龄都大。这波“赛博挖矿”,直接把Mozilla干成了历史上最安全的Firefox版本。
兄弟们,今天聊点硬核的。
最近Mozilla发了一篇爆火复盘博文,看完直接让人倒吸一口凉气——那只叫Claude Mythos的AI,在短短一个月内,帮Firefox干掉了423个安全漏洞。你没看错,423个,不是4.23个。1
更离谱的是,这4月份的修复量,比Firefox此前整整15个月加起来的还要多。1 降维打击?不,这简直是降维“屠杀”。
真正的“顶级猎手”:从全网笑柄到降维打击
几个月前,AI写的漏洞报告还是开源社区的“噩梦”。
说得好像有模有样,结果全是幻觉(Slop)。维护者花大量时间去验证一个“惊天大发现”,最后发现是个“平平无奇的误会”。那时候大家的态度很统一:AI写代码?行。AI找Bug?别闹了。
但现在,情况彻底变了。
Mozilla工程师的原话是:“突然之间,这些bug变得非常好找。”1
规矩就两条:第一,模型自己变强了;第二,工程师们学会了怎么用好它。这两条曲线一相乘,结果就是一个月423个漏洞的恐怖数据。
最猛的是,这423个漏洞里,有271个是Mythos直接挖出来的。1 其中:
- 180个被评为“高危”(sec-high)
- 80个评为“中危”
- 11个评为“低危”
180个高危漏洞是什么概念?这意味着只要用户正常浏览网页,就有可能被攻击者远程控制。过去这种级别的漏洞,只能靠外部白帽子花几万美金悬赏才能挖到一二,现在Mythos像“秋天扫落叶”一样,一把扫了271个。
更离谱的是,有个HTML <legend>元素的漏洞,已经在代码里躺了15年;还有一个XSLT相关的Bug,蹲了整整20年。1
一个Bug比很多打工人的职业生涯还长,Mythos一来,直接被“请”出升天。
“沙箱逃逸”都能挖,这可是2万刀级别的活儿
最让安全圈震动的,不是数量,是质量。
Mythos找到了多个“沙箱逃逸”漏洞。不懂没关系,我用人话解释一下:浏览器会把每个网页关在一个“隔离间”(沙箱)里,就算网页有毒,它也跑不出去。而“沙箱逃逸”,就是找到办法从隔离间“越狱”,获得控制整个电脑的权限。
这种漏洞有多难找?连最自动化的模糊测试(Fuzzing)都很难覆盖,是漏洞赏金体系里的“天花板”,Mozilla开出的最高赏金是2万美金一个。1
结果呢?Firefox安全工程师Brian Grinstead无奈表示:“Mythos找到的沙箱逃逸漏洞数量,已经超过了所有人类安全研究员的总和。”1
Mythos是怎么干的?它会自己写一段恶意代码注入沙箱进程,然后让这段代码去攻击浏览器最安全的部分。这需要“创造性思维”和对多进程架构的深度理解——而AI,做到了。
Agentic Harness:不只是模型强,是“工程魔法”
光有模型还不够,得有一套能跑的“流水线”。
早期的AI做静态代码分析,误报率极高,根本没法用。而Mozilla和Anthropic搞出来的这套Agentic Harness,才是真正的“幕后黑手”。1
它的逻辑很简单:发现漏洞 → 动态验证(写测试用例来复现,不能复现的自动淘汰)→ 去重 → 跟踪修复。
一开始,工程师需要手动盯着模型跑,调Prompt。跑通之后,就开始并行化,在多台临时虚拟机上同时扫描。最妙的是,一旦Pipeline搭好,换模型就是改一行代码的事。1
从Claude Opus 4.6切换到Mythos Preview,无缝衔接,直接起飞。
这也解释了为什么很多安全专家评价:“真正的杠杆在Harness的工程能力,不只在模型本身。”
100多人连夜加班,AI不是一个人在战斗
这里得泼一盆冷水:AI没在自动修Bug。
每一个被Mythos揪出来的漏洞,都需要一个工程师写补丁,另一个做代码审查。AI写的补丁只能当参考,不能直接上线。
为了接住这波史无前例的“漏洞洪流”,Mozilla出动了超过100名工程师,有人写补丁,有人做审查,有人搭管道,有人管发布……这是Firefox历史上最大规模的安全修复行动。1
你可以理解成:Mythos是个不知疲倦的“哨兵”,它在黑夜里一个人发现了成千上万个敌人。但真正要上阵肉搏、修补城墙的,是那100多个纯人类工程师。
正面对决:Anthropic VS OpenAI,谁才是“赛博警察”?
Firefox的423个漏洞,只是冰山一角。
Anthropic发布了Mythos后,直接祭出了“Project Glasswing”(玻璃翼计划),声称Mythos已经在每一个主流操作系统和浏览器中发现了数千个高危漏洞,甚至包括一个潜伏了27年的漏洞OpenBSD。1
然后,Anthropic做了一个“骚操作”:他们把最强模型亲手关了起来。——不公开,只给经过严格审查的防御者使用。
而OpenAI走了另一条路:尽可能广泛地开放。
GPT-5.4-Cyber紧随其后发布,并扩展到数千名个人防御者和数百个安全团队。最新的GPT-5.5-Cyber,在UK AI Security Institute(AISI)的测试中,与Claude Mythos打了个平手,甚至在部分专家级任务上还略有反超。2
OpenAI的逻辑很清楚:通过身份验证+分级授权,让尽可能多的“好人”拿到尽可能强的武器。
如今,两家巨头都在拼命建墙。但AI安全能力的扩散速度,可能比他们建墙的速度更快。
最后的思考
Mythos和GPT-5.5-Cyber的出现,标志着一个新时代:AI不再是代码的辅助者,而是代码的“审判者”。
当你还在纠结“AI会不会取代程序员”时,AI已经开始替你检查那些藏了20年的“历史遗留问题”了。
这很好。这很吓人。但这也很酷。
未来已来,只是分布不均——有些Bug,终于等到了它的“克星”。