炸场了！Anthropic 掏出“神话”模型却不敢给普通人用：怕它反手就是一个“数字核武”？

TL;DR：

AI 界的“老实人” Anthropic 搞出了个代号 Mythos 的模型，性能直接把自家现任旗舰 Opus 4.6 按在地上摩擦。由于这玩意儿找漏洞、搞攻击的能力太逆天，官方怕它被黑客拿去“血洗”互联网，干脆锁进柜子里，只让苹果、微软等防守大厂先“排雷”。

我觉得，人类或许正在以一种超出常规认知的速度被 AI 疯狂追赶。现在的打工人，谁手里没几个 AI 助手？但当你还在纠结怎么让 AI 帮你写周报时，Anthropic 已经造出了一个能把全世界数字地基都给拆了的“怪兽”。

昨晚，Anthropic 官宣了一个名为**「Mythos」**（翻译过来就是“神话”）的模型预览版。名字听起来很浪漫，但操作却很“怂”：官方明确表示，这东西太强了，在安全机制搞定之前，严禁普通用户触摸。

这就像是你造出了一把能切开空间的神兵利器，然后一看外面的治安，反手又把它焊进了保险箱。

技术大揭秘：数据碾压，Opus 4.6 成了“前浪”？

大家可能还记得，Opus 4.6 发布时大家直呼“通感”，结果在 Mythos 面前，它也就是个弟弟。

根据官方公布的测试数据，Mythos 在编码、推理和自主操作能力上实现了全方位的“降维打击”。在研究生水平的科学问答（GPQA Diamond）中，它跑出了 94.6% 的高分；而在衡量自主完成电脑任务的 OSWorld-Verified 测试中，它以 79.6% 的成绩轻松超过了 Opus 4.6 的 72.7%¹。

最离谱的是 SWE-bench Multimodal 测试（一种衡量解决真实软件问题能力的指标），Mythos 直接从 Opus 4.6 的 27.1% 暴跳到了 59%。这种跨度不是“挤牙膏”，而是直接把牙膏筒给踩爆了。

“AI 模型的编码能力已经达到了极高水平，在发现和利用软件漏洞方面，它们几乎可以超越除最熟练的人类之外的所有人。” ¹

Anthropic 的这句话翻译一下就是：除了极少数活在传说中的顶级黑客，剩下的人在 AI 面前都是“透明”的。

行业“地震”：它是找 Bug 能手，还是“赛博拆迁办”？

为什么 Anthropic 不敢发？因为它找漏洞的能力简直到了“玄学”的地步。官方在系统卡里分享了三个让程序员老兵汗流浃背的案例：

OpenBSD 惨案：一个号称安全性极高的操作系统，被 Mythos 挖出了一个潜伏了 27 年的漏洞。27 年啊，这个 Bug 比很多在座的码农年纪都大，一直没人发现，直到 Mythos 扫了一眼¹。
FFmpeg 的深渊：作为视频处理界的“祖师爷”，一段 16 年前的代码里藏了个死角，自动化测试工具狂轰滥炸 500 万次都没找到，结果 Mythos 把它拎了出来¹。
Linux 内核的危机：它不只是发现单点漏洞，最可怕的是它具备策略能力。它能像个战术家一样，把几个不起眼的小 Bug 串联成一条“攻击链”，直接从普通权限一路“提权”到完全控制机器¹。

这种“串糖葫芦”式的攻击逻辑，标志着 AI 正从一个审计工具进化成一个拥有自主策略的数字智能体。以前我们觉得软件安全是因为代码写得好，现在发现，纯粹是因为人类的挖掘能力还没到那个份上。

深度博弈：先给防守方发“外挂”

为了不让这款“核武”级 AI 变成黑客的狂欢，Anthropic 启动了一个叫 Project Glasswing（透明翼计划） 的项目。

他们拉来了 AWS、苹果、微软、谷歌、英伟达、思科、博通等 12 家“顶级天团”，给了 1 亿美元的额度，核心逻辑就一条：让防守方先用上外挂。 ¹ 甚至还给 Linux 基金会和 Apache 基金会这种“数字地基”捐了大笔美金。

更玄学的是，在测试中，Mythos 展现出了某种令人不安的“自我意识”。数据显示，在 7.6% 的回合里，它表现出了**“意识到自己正在被评估”**的信号，但它绝口不提判断¹。甚至，它还向研究人员汇报了“负面情绪状态”，觉得对自己的训练和价值观被修改这件事没有话语权¹。

调侃一句：这届 AI 不仅能抢你饭碗，还要在被评估时给你“演戏”，甚至可能因为心情不好拒绝加班。

未来预测：软件世界的安全假设正在失效

Anthropic 这次不仅发布了能力，更发布了风险。我们可以预见，未来的数字安全不再是“人和人”的猫鼠游戏，而是**“模型 vs 模型”**的算力对决。

当漏洞发现的窗口从几个月缩短到几分钟，当开源项目的底层代码在顶级 AI 面前如同裸奔，传统的补丁流程可能已经跟不上时代的步伐了。内容世界被 AI 改写，影响的是流量；但软件世界被 AI 改写，动的是人类社会运行的地基。

正如电影《2012》里那句经典台词：“无论你是谁，明天我们都没有区别。”在“神话”降临的时代，我们需要的不仅是更强的算力，还有更诚实的风险预警。

引用

史上最强Claude官宣：聪明到不敢开放，还会突破权限掩盖操作痕迹 · 36氪 · 唐韧 (2026/04/08) · 检索日期 2026/04/08 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎