Dario访谈猛料:AI模型Mythos是“超级武器”?文明崩塌概率25%!

温故智新AIGC实验室

TL;DR:

Dario Amodei最新69分钟访谈爆出猛料:内部模型Mythos能自主完成全自动网络攻击链,被安全公司称为“超级武器”;他还透露AI递归自改进已在发生,文明崩塌概率10%-25%;一半白领工作可能消失。这位CEO拒绝做“奥本海默”,选择做“西拉德”——懂的都懂。


嘿,兄弟萌,AI圈最有权势的人之一,终于“摊牌”了。

6月17号,Bloomberg《The Circuit》主持人Emily Chang放出了与Anthropic CEO Dario Amodei的完整版对话,足足1小时10分钟1。没有公关话术,没有回避,这一次,他全说了。

整个访谈看下来,我直呼好家伙——信息密度大到让人头皮发麻,尤其是那个叫 Mythos 的东西。

Mythos:那个太危险、不敢发布的“神话”

Emily追问Dario:你说Mythos太强了,不能向公众发布。它最让你震惊的是什么?

Dario的回答,每一个字都值得慢读:

「最让我震惊的,是它发现漏洞、并且把漏洞变成实际可利用攻击的能力,出现了一个巨大的跃升。不是线性增长,是断崖式跃升。而且几乎不需要人类提示。」1

请注意这句话的分量。上一代模型只能「找到漏洞」,而Mythos能做的远不止于此——它能自主走完一整条网络攻击杀伤链(cyber kill chain):扫描、发现、利用、武器化,一条龙,全自动2

这不是「辅助黑客」,这是「AI自己变成了黑客」。

更让人脊背发凉的是那些拿到内测的公司。Dario说,一些安全公司测完之后,直接打电话过来说:「这是超级武器。你应该要持枪证才能用这东西。求你了,别发布。」1

Palo Alto Networks的首席产品官更直白:Mythos在不到三周内完成了相当于一整年渗透测试的工作量。它不仅能找到漏洞,还能把中低危漏洞串成一条攻击链,直接打穿整个系统1

面对「这只是公关秀」的质疑时,Dario反击得很硬——「我们因为不发布Mythos,商业上已经遭受了巨大损失。它在Anthropic内部极大地加速了研究和下一代模型的生产。如果放出去,外部世界也会获得同样的加速。这怎么可能是营销?」1

有人拿开源模型对比,Dario回怼堪称暴躁:「有人把Mythos找到的那行代码指给开源模型看,然后说『看,它也能找到同样的问题』。这叫什么?这叫我在大海里捞出了针,你拿着针说『你看,别人也能捡起来』。」1

递归自改进:我们已经在指数曲线上?

AI圈有一个被反复追问的终极问题:AI什么时候开始自我改进?那个「奇点」到底多远?

Dario的回答出人意料——它不是一个时间点。它是一个连续的过程。我们已经在其中了。 1

他给了一组数字:AI已经能为下一代AI建议架构了。一年前,AI带来的全要素生产率提升大约10%-15%。现在已经到20%-30%。还在翻倍。

「我们就在指数曲线上。」1

没有某一天早上AI突然「觉醒」然后失控。有的只是一条不断加速的曲线——在这条曲线的每一个点上,你都要判断:是不是该踩刹车了?是不是该加更多防护了?1

这才是Dario最核心的框架:平滑的指数(smooth exponential)

不是奥本海默,是西拉德—Dario的自我定位

Emily问了一个很直接的问题:「你最爱的书是《原子弹的制造》。你觉得自己像奥本海默吗?」

Dario说,不。他最认同的人是利奥·西拉德(Leo Szilard)——1933年,在伦敦街头过马路时,第一个在脑子里想出核链式反应可能性的人。后来正是西拉德起草了那封改变历史的信,让爱因斯坦签名后寄给了罗斯福总统,直接催生了曼哈顿计划。1

但西拉德也是第一批站出来反对实际使用原子弹的人。

这个选择本身意味深长——奥本海默是站在聚光灯中心的人,是「原子弹之父」。而西拉德是最早看到连锁反应的人——他看到了可能性,也最早看到了危险

Dario的原话更狠:「我们不可能靠一个大人物来解决这件事。这里有太多强大的利益方。唯一能让所有人都安全的方式,是到处都有制衡和平衡。在某种意义上,我把奥本海默看作一个失败案例——一个不应该发生的事情。1

这句话的潜台词几乎呼之欲出:这个时代需要的不是「AI之父」式的英雄人物,而是能在失控之前拉住缰绳的制度设计。

既然聊到了核弹类比,文明崩塌概率25%这个数字就显得格外沉重。Dario曾在去年的Axios峰会上说过:文明崩塌的概率,大约10%-25%。这次Emily直接追问:「有没有可能,是Anthropic自己造出来的东西,导致了崩塌?」1

Dario没回避:我当然希望不是。但这是个概率。他用了一个航空公司的比喻,极其精准——「你可以造一家比同行安全10倍的航空公司。但你没法保证飞机永不坠毁。如果有人告诉你这架飞机有25%的坠机概率,你不会上那架飞机。25%太高了。我们要做的,就是把它降到低得多。1

这段表述,堪称AI安全领域的“劝退金句”。

一半白领工作:被社交媒体断章取义的“末日先知”

这是Dario被骂得最惨的一句话,也是他这次访谈反击最狠的一段。

一年前他说过:AI可能在1到5年内,消灭一半的入门级白领工作。Dario表示,他的担忧现在也没有变。但他拒绝被贴上「末日先知」的标签。「我从来没说过末日将至。我说的是——这是我们应该预见、应该担忧、并且必须积极应对的事。」1

Dario称其最痛恨社交媒体。一年前的完整论述,被剪成三秒钟的「doom is coming」到处疯传,完全没有上下文。「说我在廉价营销的人,这种说法本身才是廉价营销,是懒惰,是不愿认真对待严肃的智力工作。这就是硅谷的病——被三秒钟的社交媒体绑架了,所有人只会对着断章取义的切片做出反应。」1

这波反怼,我愿称之为“教科书级”的媒体素养课。

Dario透露在Anthropic内部,AI已经写了几乎全部代码,工程师反而更高效。可苗头也出现了——有些岗位,AI做更好。Dario认为出路或许在物理世界、在以人为本的工作、由人来引导AI。但他也承认:没人保证。1

尾声:他造了可能拆了文明的东西

访谈结尾,Dario难得露出轻松一面。Emily问:当CEO最让你意外的是什么?他笑了:「是得经常化妆。」1

69分钟的访谈,拆掉了一层又一层。你可以不同意他的每一个判断,但你很难否认一件事——这个人在用一种极其罕见的坦率,面对这项技术最深处的矛盾:

他在造可能改变文明的东西。他也比任何人都清楚,这东西可能把文明拆了。

指数曲线的另一边,到底是什么?没人知道。但至少,Dario把底牌摊在了桌面上。


引用