AI也紧张?Claude Mythos断网秒杀80年数学难题,比OpenAI更短更优雅

温故智新AIGC实验室

###TL;DR

这周AI圈卷疯了:OpenAI刚用125页论文踹翻Erdős的80年猜想,Anthropic的Claude Mythos断网操作下,竟找到一条更短更美的证明路径。最绝的是,模型第一个可行解就紧张得停手了——数学家看了直呼“我懂你”。


数学界这周的信息密度,高到离谱。

5月20日,OpenAI官宣内部推理模型自主反驳了Erdős单位距离猜想,125页思维链震撼学界1。同一天,普林斯顿教授Will Sawin贴出手工改进版,直接把指数从6×10⁻³⁸干到0.014,10³⁵倍的差距2

5月21日,DeepMind的AlphaProof Nexus一口气啃下9道Erdős题,每道推理成本几百美元3

然后,5月26日,Anthropic也亮出了独立证明——更离谱的是,路径比OpenAI短得多

带头搞事的是Levent Alpoge,哈佛本科满分、剑桥Part III、普林斯顿博士,2015年拿过Morgan Prize。2023年GPT-4一出,他立刻被击中了:“它瞬间成了人类有史以来最有趣的东西”,然后转头就加入了Anthropic4

这周OpenAI发成绩单之后,Levent做了一件“显而易见的事”——让Mythos也试试。为了公平,全程断网,杜绝从OpenAI公开解法里“抄作业”。多个Claude Code实例各自独立运行,确保纯原创5

结果?模型不仅找到了和OpenAI类似的解法,还发现了一条完全不同的、更简洁的路。

最有意思的细节是:模型明明已经找到了一个能推翻猜想的方案,却在第一个可行答案上停了下来。明明往前走一步就能拿到更强的结果,但Mythos不敢置信——它太紧张了。

Levent直接乐了:“这种感觉,所有数学家都懂!”5


80年没人赢过的赌注

1946年,匈牙利数学家Paul Erdős提了一个听起来极简单的问题:在平面上撒n个点,最多能有多少对点之间的距离恰好是1?他给出了一个答案:排成方格网格,单位距离对的数量大约是n^(1+c/log log n)。然后他下了赌注:这就是极限了,没人能做得更好1

80年来,所有人都在这个框架里打转。关键瓶颈在于高斯整数Z[i]——一个固定范数所能分解出的方式,被除数函数死死卡住。

Mythos的“拆墙术”

对于人类数学家来说,代代相传的直觉是“答案要在Z[i]里找”。Mythos没读过这个传统,一上来就把Z[i]换成了次数远大于2的数域K的整数环O_K。

听起来像“用大炮打蚊子”,但就是这种跨学科的暴力,撬开了80年的僵局。

具体手法:利用Golod-Shafarevich判则,在一个二次域上搭建无限高的“数域塔”,然后对每一层取四次根扩张。核心机制:不管塔造多高,数域的“复杂度密度”始终有界。一旦参数变大,几何计数就能启动。

在Erdős的Z[i]里,单位群只有四个元素,能往外伸的“单位距离方向”就这么几个。但在高维数域里,单位群的秩随维度增长,van der Corput定理直接把秩转化为方向数——4个方向变成了随维度爆炸式增长。

用一个更形象的说法:Erdős被困在一个只有4个出口的房间里,Mythos把墙拆了。

单位距离方向数增长为exp(Ω(d log log d)),而所有其他损耗全是exp(O(d))量级。d log log d碾压d。Erdős的猜想,就这样被推翻了5

整个论证没有任何解析上的复杂性,比OpenAI那条125页路径精简得多。

从笑话到《数学年刊》

要知道,七个月前AI做数学还是个笑话。2025年10月,OpenAI时任VP Kevin Weil宣称GPT-5解决了10个Erdős问题,结果数学家Thomas Bloom当场回怼“严重歪曲事实”,Yann LeCun和Demis Hassabis也跟着嘲讽。Weil删了帖,四个月后离开了OpenAI1

转眼今天,Bloom签了验证报告。菲尔兹奖得主Tim Gowers写下“提交到《数学年刊》我会毫不犹豫推荐接受”。数学家Litt说这是“AI自主产出的第一个让我觉得本身就有意思的结果”,还在Nature采访中表示:“没有人类能像LLM那样吸收全部数学文献。AI正在打破学科之间的壁垒。”1

三年前GPT-4还做不了本科数学题。如今,让最伟大数学家都绝望的Erdős问题,正在变成AI的入学考试。

打破80年僵局的,是一个不知道“这题应该怎么想”的模型。没有包袱,反而能从代数数论里借来重武器去打一道几何题。

Erdős留下了超过1000道未解题——这周又解了1道。下一次,会是哪家?会花多久?


参考资料


  1. AI模型自主破解80年数学难题·OpenAI(2026/5/20)·检索日期2026/5/27 ↩︎ ↩︎ ↩︎ ↩︎

  2. Will Sawin手工改进版arXiv论文(链接待确认,原文提及)·检索日期2026/5/27 ↩︎

  3. DeepMind AlphaProof Nexus一口气啃下9道Erdős题·DeepMind(2026/5/21)·检索日期2026/5/27 ↩︎

  4. Levent Alpoge个人背景及推特(2026/5/27)·检索日期2026/5/27 ↩︎

  5. Anthropic官方证明全文PDF(2026/5/27)·检索日期2026/5/27 ↩︎ ↩︎ ↩︎