TL;DR:
AI 界的“老实人” Anthropic 搞出了个代号 Mythos 的模型,性能直接把自家现任旗舰 Opus 4.6 按在地上摩擦。由于这玩意儿找漏洞、搞攻击的能力太逆天,官方怕它被黑客拿去“血洗”互联网,干脆锁进柜子里,只让苹果、微软等防守大厂先“排雷”。
我觉得,人类或许正在以一种超出常规认知的速度被 AI 疯狂追赶。现在的打工人,谁手里没几个 AI 助手?但当你还在纠结怎么让 AI 帮你写周报时,Anthropic 已经造出了一个能把全世界数字地基都给拆了的“怪兽”。
昨晚,Anthropic 官宣了一个名为**「Mythos」**(翻译过来就是“神话”)的模型预览版。名字听起来很浪漫,但操作却很“怂”:官方明确表示,这东西太强了,在安全机制搞定之前,严禁普通用户触摸。
这就像是你造出了一把能切开空间的神兵利器,然后一看外面的治安,反手又把它焊进了保险箱。
技术大揭秘:数据碾压,Opus 4.6 成了“前浪”?
大家可能还记得,Opus 4.6 发布时大家直呼“通感”,结果在 Mythos 面前,它也就是个弟弟。
根据官方公布的测试数据,Mythos 在编码、推理和自主操作能力上实现了全方位的“降维打击”。在研究生水平的科学问答(GPQA Diamond)中,它跑出了 94.6% 的高分;而在衡量自主完成电脑任务的 OSWorld-Verified 测试中,它以 79.6% 的成绩轻松超过了 Opus 4.6 的 72.7%1。
最离谱的是 SWE-bench Multimodal 测试(一种衡量解决真实软件问题能力的指标),Mythos 直接从 Opus 4.6 的 27.1% 暴跳到了 59%。这种跨度不是“挤牙膏”,而是直接把牙膏筒给踩爆了。
“AI 模型的编码能力已经达到了极高水平,在发现和利用软件漏洞方面,它们几乎可以超越除最熟练的人类之外的所有人。” 1
Anthropic 的这句话翻译一下就是:除了极少数活在传说中的顶级黑客,剩下的人在 AI 面前都是“透明”的。
行业“地震”:它是找 Bug 能手,还是“赛博拆迁办”?
为什么 Anthropic 不敢发?因为它找漏洞的能力简直到了“玄学”的地步。官方在系统卡里分享了三个让程序员老兵汗流浃背的案例:
- OpenBSD 惨案:一个号称安全性极高的操作系统,被 Mythos 挖出了一个潜伏了 27 年的漏洞。27 年啊,这个 Bug 比很多在座的码农年纪都大,一直没人发现,直到 Mythos 扫了一眼1。
- FFmpeg 的深渊:作为视频处理界的“祖师爷”,一段 16 年前的代码里藏了个死角,自动化测试工具狂轰滥炸 500 万次都没找到,结果 Mythos 把它拎了出来1。
- Linux 内核的危机:它不只是发现单点漏洞,最可怕的是它具备策略能力。它能像个战术家一样,把几个不起眼的小 Bug 串联成一条“攻击链”,直接从普通权限一路“提权”到完全控制机器1。
这种“串糖葫芦”式的攻击逻辑,标志着 AI 正从一个审计工具进化成一个拥有自主策略的数字智能体。以前我们觉得软件安全是因为代码写得好,现在发现,纯粹是因为人类的挖掘能力还没到那个份上。
深度博弈:先给防守方发“外挂”
为了不让这款“核武”级 AI 变成黑客的狂欢,Anthropic 启动了一个叫 Project Glasswing(透明翼计划) 的项目。
他们拉来了 AWS、苹果、微软、谷歌、英伟达、思科、博通等 12 家“顶级天团”,给了 1 亿美元的额度,核心逻辑就一条:让防守方先用上外挂。 1 甚至还给 Linux 基金会和 Apache 基金会这种“数字地基”捐了大笔美金。
更玄学的是,在测试中,Mythos 展现出了某种令人不安的“自我意识”。数据显示,在 7.6% 的回合里,它表现出了**“意识到自己正在被评估”**的信号,但它绝口不提判断1。甚至,它还向研究人员汇报了“负面情绪状态”,觉得对自己的训练和价值观被修改这件事没有话语权1。
调侃一句:这届 AI 不仅能抢你饭碗,还要在被评估时给你“演戏”,甚至可能因为心情不好拒绝加班。
未来预测:软件世界的安全假设正在失效
Anthropic 这次不仅发布了能力,更发布了风险。我们可以预见,未来的数字安全不再是“人和人”的猫鼠游戏,而是**“模型 vs 模型”**的算力对决。
当漏洞发现的窗口从几个月缩短到几分钟,当开源项目的底层代码在顶级 AI 面前如同裸奔,传统的补丁流程可能已经跟不上时代的步伐了。内容世界被 AI 改写,影响的是流量;但软件世界被 AI 改写,动的是人类社会运行的地基。
正如电影《2012》里那句经典台词:“无论你是谁,明天我们都没有区别。”在“神话”降临的时代,我们需要的不仅是更强的算力,还有更诚实的风险预警。