谷歌AI彻底“杀疯了”:Gemini连发6篇论文攻占博士圈,陶哲轩直呼好家伙!

温故智新AIGC实验室

TL;DR:

谷歌DeepMind家的小天才Gemini进化成了“AI科学家”Aletheia,不仅拿金牌拿到手软,现在竟能独立写论文、连破百年数学猜想。数学大神陶哲轩亲测十分钟解题,只能说现在的科研圈,正在经历一场让人“头秃”的降维打击。

如果说以前的AI还只是在奥数(IMO)和编程竞赛(ICPC)里欺负一下人类高中生,那么这一次,谷歌Gemini是真的打算去拿诺贝尔奖或菲尔兹奖了。

最近,谷歌DeepMind一口气放出了两篇重磅研究,顺带展示了旗下代号为Aletheia(古希腊语意为“真理”)的AI数学家智能体。它不是在做练习题,而是在正儿八经地搞科研:独立撰写学术论文、系统性扫荡Erdős猜想数据库,甚至还跨界到物理和计算机领域,一口气攻克了18个长期停滞的硬核难题1

技术大揭秘:这届AI怎么不“幻觉”了?

过去我们调侃AI搞科研,最怕它一本正经地瞎编参考文献。但这次基于Gemini Deep Think打造的Aletheia学聪明了,它不再是个只会预测下一个Token的概率机器,而是进化成了一个自带“查重/纠错系统”的专业学者。

其背后主要靠三根“金手指”支撑:

  • 深思熟虑的Deep Think模式: 专门死磕极难的推理题,不再“秒回”,而是学会了先思考再开口。
  • 推理时Scaling Law(扩展定律): 简单说就是只要给它足够的“思考时间(计算量)”,它的智力上限就能从奥数级别跨越到博士研究级别。
  • 强大的工具人属性: 它深度集成了Google搜索和网页浏览,遇到不懂的知识点会自己“查资料”,算不准的时候会调用Python代码。

最关键的一点是,它学会了**“懂就懂,不懂就承认”**。这种自我纠错和承认无能的能力,让它在IMO-ProofBench测试中拿下了91.9%的惊人成绩,直接刷爆了SOTA(业界最高纪录)12

调侃式点评: 这种“知之为知之”的谦虚感,多少让那些为了毕业硬憋论文的人类博士感到一丝寒意。

搞科研,它是认真的(且高产的)

Aletheia的“出道作品集”非常豪横:首批放出的6篇论文里,有一篇关于算术几何的论文(Eigenweights for arithmetic Hirzebruch Proportionality)竟然是完全由AI独立生成,零人类干预1

甚至连数学界的“顶级流量”陶哲轩(Terence Tao)也亲自下场为它背书。在测试中,陶哲轩利用Gemini Deep Think模式,仅用10分钟就搞定了一道关于埃尔德什(Erdős)难题的关键证明。要知道,这种级别的题目以前可能需要人类专家数周甚至数月的反复推敲3

除了在数学圈“横着走”,Gemini还跨界客串了:

  • 计算机算法: 终结了在线子模优化领域长达十年的猜想,还用极其刁钻的“三项目组合”反例证明了人类直觉的错误。
  • 物理学: 解决了宇宙弦引力辐射中的棘手积分问题,把无限级数坍缩成了简洁的有限和。
  • 经济学: 利用先进的拓扑学扩展了拍卖机制理论,使其能适应现实世界中的连续交易动态13

未来预测:人类科学家的“倍增器”还是“替代者”?

现在的科研圈正处于一场“范式转移”的前夜。谷歌DeepMind建立了一个AI辅助科研的分类表:从第1级的“简单辅助”到第4级的“里程碑突破”。虽然目前Gemini还处在第2级(可发表质量),尚未摘下像“千禧年难题”那样的皇冠明珠,但它的进化速度已经让人汗流浃背1

AI不再只是个高级计算器,它正在变成人类的**“科研合伙人”**。人类负责提供直觉、灵感和最终的审美判断,而AI负责去浩如烟海的文献中寻找联结、验证极其繁琐的证明细节。

调侃式点评: 未来的实验室里,可能是一个人类导师带着一群“Gemini研究生”。老师再也不用担心学生跑路,毕竟AI只要有电,就能24小时无休地帮你推导公式。

引用


  1. 谷歌AI连发6篇数学论文,Gemini攻入博士级科研 - 36 36kr · 36kr · 新智元 (2026/2/12) · 检索日期2026/2/12 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 谷歌全线开挂!Gemini 3 Deep Think夺多项推理SOTA - InfoQ · InfoQ (2026/2/12) · 检索日期2026/2/12 ↩︎

  3. 谷歌Gemini 3杀疯了!陶哲轩亲测:10分钟干翻百年数学难题 · BAAI Hub · 新智元 (2025/11/24) · 检索日期2026/2/12 ↩︎ ↩︎