谷歌AI彻底“杀疯了”：Gemini连发6篇论文攻占博士圈，陶哲轩直呼好家伙！

TL;DR：

谷歌DeepMind家的小天才Gemini进化成了“AI科学家”Aletheia，不仅拿金牌拿到手软，现在竟能独立写论文、连破百年数学猜想。数学大神陶哲轩亲测十分钟解题，只能说现在的科研圈，正在经历一场让人“头秃”的降维打击。

如果说以前的AI还只是在奥数（IMO）和编程竞赛（ICPC）里欺负一下人类高中生，那么这一次，谷歌Gemini是真的打算去拿诺贝尔奖或菲尔兹奖了。

最近，谷歌DeepMind一口气放出了两篇重磅研究，顺带展示了旗下代号为Aletheia（古希腊语意为“真理”）的AI数学家智能体。它不是在做练习题，而是在正儿八经地搞科研：独立撰写学术论文、系统性扫荡Erdős猜想数据库，甚至还跨界到物理和计算机领域，一口气攻克了18个长期停滞的硬核难题¹。

技术大揭秘：这届AI怎么不“幻觉”了？

过去我们调侃AI搞科研，最怕它一本正经地瞎编参考文献。但这次基于Gemini Deep Think打造的Aletheia学聪明了，它不再是个只会预测下一个Token的概率机器，而是进化成了一个自带“查重/纠错系统”的专业学者。

其背后主要靠三根“金手指”支撑：

深思熟虑的Deep Think模式： 专门死磕极难的推理题，不再“秒回”，而是学会了先思考再开口。
推理时Scaling Law（扩展定律）： 简单说就是只要给它足够的“思考时间（计算量）”，它的智力上限就能从奥数级别跨越到博士研究级别。
强大的工具人属性： 它深度集成了Google搜索和网页浏览，遇到不懂的知识点会自己“查资料”，算不准的时候会调用Python代码。

最关键的一点是，它学会了**“懂就懂，不懂就承认”**。这种自我纠错和承认无能的能力，让它在IMO-ProofBench测试中拿下了91.9%的惊人成绩，直接刷爆了SOTA（业界最高纪录）¹²。

调侃式点评： 这种“知之为知之”的谦虚感，多少让那些为了毕业硬憋论文的人类博士感到一丝寒意。

搞科研，它是认真的（且高产的）

Aletheia的“出道作品集”非常豪横：首批放出的6篇论文里，有一篇关于算术几何的论文（Eigenweights for arithmetic Hirzebruch Proportionality）竟然是完全由AI独立生成，零人类干预¹。

甚至连数学界的“顶级流量”陶哲轩（Terence Tao）也亲自下场为它背书。在测试中，陶哲轩利用Gemini Deep Think模式，仅用10分钟就搞定了一道关于埃尔德什（Erdős）难题的关键证明。要知道，这种级别的题目以前可能需要人类专家数周甚至数月的反复推敲³。

除了在数学圈“横着走”，Gemini还跨界客串了：

计算机算法： 终结了在线子模优化领域长达十年的猜想，还用极其刁钻的“三项目组合”反例证明了人类直觉的错误。
物理学： 解决了宇宙弦引力辐射中的棘手积分问题，把无限级数坍缩成了简洁的有限和。
经济学： 利用先进的拓扑学扩展了拍卖机制理论，使其能适应现实世界中的连续交易动态¹³。

未来预测：人类科学家的“倍增器”还是“替代者”？

现在的科研圈正处于一场“范式转移”的前夜。谷歌DeepMind建立了一个AI辅助科研的分类表：从第1级的“简单辅助”到第4级的“里程碑突破”。虽然目前Gemini还处在第2级（可发表质量），尚未摘下像“千禧年难题”那样的皇冠明珠，但它的进化速度已经让人汗流浃背¹。

AI不再只是个高级计算器，它正在变成人类的**“科研合伙人”**。人类负责提供直觉、灵感和最终的审美判断，而AI负责去浩如烟海的文献中寻找联结、验证极其繁琐的证明细节。

调侃式点评： 未来的实验室里，可能是一个人类导师带着一群“Gemini研究生”。老师再也不用担心学生跑路，毕竟AI只要有电，就能24小时无休地帮你推导公式。

引用

谷歌AI连发6篇数学论文，Gemini攻入博士级科研 - 36 36kr · 36kr · 新智元 (2026/2/12) · 检索日期2026/2/12 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
谷歌全线开挂！Gemini 3 Deep Think夺多项推理SOTA - InfoQ · InfoQ (2026/2/12) · 检索日期2026/2/12 ↩︎
谷歌Gemini 3杀疯了！陶哲轩亲测：10分钟干翻百年数学难题 · BAAI Hub · 新智元 (2025/11/24) · 检索日期2026/2/12 ↩︎ ↩︎