AI「几小时攻破NSA」刷屏?真相是红队演练,但能力确实有点吓人

温故智新AIGC实验室

TL;DR

全网疯传AI模型Mythos几小时攻破NSA机密系统,结果是一场授权的红队演练。但别急着嘲笑,虽然“入侵”是假的,但AI的漏洞挖掘速度是真的,已经快到让网络安全行业坐不住了。

最近,一句“AI几小时攻破NSA”在英文互联网刷屏,吓得吃瓜群众以为赛博末日提前降临。

“Mythos几小时就攻破了我们几乎所有机密系统,不是几周,是几小时。”这句出自美国参议员之口、经《经济学人》加持的“名言”,让Anthropic的模型Mythos瞬间封神。

然而,真相就像反转剧——它是一次授权的网络安全红队测试。啥意思?就是NSA自己请AI来“打”自己的靶场,找自己的漏洞,不是真正的黑客攻击。

用网友的话说,这就跟“消防演习写成大楼着火”差不多。

这场闹剧是怎么传歪的?

故事要从一句原意是“该给AI上强制测试”的话说起,结果经过NSA局长→参议员→记者→社交平台,四轮转手,变成了一条炸裂新闻。

《经济学人》记者Shashank Joshi后来亲自下场降温:他说自己写文章时为了凸显模型能力强,没加“特定条件下”这个限定词,是个失误。1

Mythos确实强,但人家的强是在“受控环境”+“特定工具”+“授权测试”下,几小时扫穿了一套国家级机密系统的副本。这事儿就像你在游戏里开了外挂打副本,和真去黑服务器是两码事。

Mythos到底有多“危险”?

别被“演习”两个字骗了,Mythos的能力确实恐怖。

它能做什么?

  • 找漏洞的速度:Anthropic说,它已经帮第一批合作伙伴揪出了上万个高危或严重级漏洞,其中有些漏洞在代码里躺了27年都没被人发现。2
  • 推理攻击路径:它能自主串联3-5个不起眼的小漏洞,形成一套完整的攻击链路,从初始入侵到拿到管理员权限,全程不靠人。
  • 成本极低:以往安全团队需要数月、花费数十万美元才能完成的漏洞挖掘,Mythos几小时内就能搞定,成本不到2万美元,单个漏洞成本低至50美元。3

这速度,等于把漏洞从“古董级”直接推到了“外卖级”。

所以,Anthropic自己都怂了。他们搞了个“玻璃翼计划”,只把Mythos授权给通过审核的防御方,比如亚马逊、苹果、微软这些巨头,普通人想都别想。4

美国政府的态度:一边封杀,一边偷偷用

这事儿最拧巴的地方来了。

今年2月,五角大楼以“供应链风险”为由,封杀了和Anthropic的合作,还要求供应商跟进。结果没过多久,特朗普总统又说“现在不是威胁了,但一周前也许是”。1

更绝的是,据Axios报道,就在打官司期间,NSA仍然在偷偷使用Mythos Preview来扫描自己的系统。5

这操作,像极了嘴上说不要,身体却很诚实。

所以,这事儿到底说明了什么?

这场“AI攻破NSA”的乌龙事件,本质上是一场关于AI能力边界的焦虑投射。

一方面,Mythos的能力确实在改变网络安全的游戏规则。漏洞发现速度被压缩到小时级,补丁周期却还以天、周计算,防守方处于绝对的劣势。

另一方面,这也敲响了警钟:当AI的攻防能力变得如此强大时,我们该如何管制这类“双刃剑”?美国政府的矛盾态度——既怕它被滥用,又离不开它的能力——恰恰说明,在AI时代,安全和地缘政治的博弈只会越来越激烈。

最后,用圈内人的话总结:可以封掉一个模型,但封不住一项能力。 更麻烦的,还在后面。


  1. 特朗普对Anthropic的封锁是任性且混乱的·经济学人·Shashank Joshi (2026/6/14)·检索日期2026/6/23 ↩︎ ↩︎

  2. 既是守护者的“火眼金睛” 又能成为攻击者的“凶器”,AI新模型拉响网络安全攻防警报·科技日报 (2026/4/17)·检索日期2026/6/23 ↩︎

  3. Claude Mythos Preview 模型能力解析:大模型攻防实测与企业应对建议·绿盟科技技术博客 (2026)·检索日期2026/6/23 ↩︎

  4. 从Mythos到GPT-5.5-Cyber:网络安全为何成为前沿AI的关键战场?·安全内参 (2026)·检索日期2026/6/23 ↩︎

  5. 美国国家安全局测试Mythos模型 对其威力印象深刻·彭博社 (2026)·检索日期2026/6/23 ↩︎