奥数金牌，**谷歌Gemini**官方认证！OpenAI却被**群嘲**，AI界的**卷王之战**升级了！

TL;DR：

各位看官，瓜来了！ 谷歌Gemini Deep Think在奥数界直接封神，拿下IMO金牌，还是官方认证的！这边厢OpenAI却因为“自宣”夺金，被啪啪打脸，大型社死现场，这波AI奥数之战，精彩到堪比神仙打架！

今天，科技圈又炸了锅！不是因为哪个新手机发布，也不是哪个大佬又说了什么金句，而是因为——AI，这个**“学霸”人设越发稳固的家伙，居然在国际数学奥林匹克竞赛（IMO）上，真的拿下金牌了！而且，是那种货真价实、官方盖章、童叟无欺的“金牌认证”。主角就是谷歌DeepMind旗下的Gemini Deep Think**，这波操作，直接把AI在数学推理领域的上限又拉高了一大截，也让友商OpenAI有点坐不住了，一场“AI奥数之争”的年度大戏，正式进入高潮。

碾压奥数神话：Gemini Deep Think的“神来之笔”

你以为奥数只是那些**“天选之子”的专属领域？那你就错了！现在，AI也来搅局了。国际数学奥林匹克竞赛，简称IMO，那可是全球数学界的“华山论剑”，自1959年起每年举办一次，汇聚了全球最顶尖的数学天才。它不光考验你的逻辑推理，还特别“刁钻”，看你的创造性思维和严谨性够不够格。能拿到金牌的，那都是选手中的“卷王”**，比例仅占前8%。

然而，就在这个人类智慧的竞技场上，谷歌DeepMind的Gemini Deep Think（高级版）却用它那**“开挂”**般的表现，震惊了所有人。在短短4.5小时内，它成功攻克了6道题中的5道，狂揽35分（满分42分），一举达到IMO金牌标准！¹

更让人拍案叫绝的是，Gemini全程仅使用纯自然语言——英语来完成解题。这和之前一些AI模型需要将问题“翻译”成复杂的**“形式语言”（比如Lean）才能处理完全不同。你想想，这不就像一个学霸，别人还得带着厚厚的参考书，他却直接用“大白话”就把最难的题解了，而且还解得思路清晰、表述精确**，连IMO主席Gregor Dolinar教授都忍不住夸赞：“这些解法在诸多方面都堪称惊艳。”¹

这波操作，不禁让人想起图灵奖得主Karpathy的**“神预言”**：“英语是热门的编程语言”。如今看来，诚不我欺！

技术大揭秘：这玩意儿到底怎么工作的？

那么，这个“别人家的孩子”——Gemini Deep Think，是如何做到如此逆天的呢？

谷歌DeepMind团队透露，他们使用了Gemini Deep Think的高级版本，一种针对复杂问题设计的增强推理模式。这套系统，简直就是给AI开了“多核CPU”：

并行思考技术：它不是那种“一条道走到黑”的AI，而是能同时探索多种解题路径，就像一个人脑子里住着好几个顶尖数学家，各司其职，最后还能**“合议”出最优解。这种“多线程推理”**，彻底突破了传统单一线性思考的局限。
强化学习训练：为了让Gemini更“聪明”，谷歌还对它进行了新颖的强化学习训练，用海量的多步推理、问题解决和定理证明数据给它**“喂饭”**，让它吃得饱，长得壮。
“考前辅导”秘籍：除了这些“硬核”技术，团队还很“贴心”地给Gemini提供了更多思考时间、过往高质量解决方案集，以及解决IMO问题的通用提示与技巧。这套**“训练+知识库+策略”的组合拳，直接把Gemini送上了IMO的“C位”**！

想象一下，这就像给你的大脑装上了**“无限算力”和“百科全书”**，还能帮你整理出“考试重点”，这谁顶得住啊！

值得一提的是，这款**“学霸版”Deep Think模型，谷歌接下来会优先给一部分数学家等测试者使用，然后嘛，就会向Google AI Ultra订阅者推出。各位“吃瓜群众”**，未来离AI帮你解数学题的日子，可能真的不远了。

行业“地震”：谁笑了谁哭了？OpenAI的“自封金牌”风波

就在谷歌DeepMind高调官宣IMO金牌的当口，隔壁的OpenAI估计有点**“破防了”。因为就在几天前，OpenAI也抢先一步，对外宣称自己的模型在IMO竞赛中获得了相当于金牌的成绩。结果呢？这一消息迅速演变成了一场巨大的争议风波**，核心问题就是：它的金牌，不是官方认证的！[1]

谷歌DeepMind的负责人Demis Hassabis连发两弹，一再强调“谷歌模型是首个获得官方金牌级别认可的AI系统”¹。IMO组委会也“亲自下场”打脸OpenAI，明确表示“OpenAI并不是与IMO合作测试模型的AI公司之一，91位IMO官方评委中没有任何人参与评估他们的答卷。这意味着，OpenAI的‘金牌’成绩完全是自说自话，没有经过官方认证。”²

更有意思的是，谷歌DeepMind超级推理团队的Thang Luong还爆料，IMO组委会其实特地明确要求，希望各大模型公司在闭幕式一周后再公布成绩，不要抢走“孩子们”的风头。结果OpenAI不仅不讲武德**“提前抢跑”，还把一个没有经过官方评分的金牌“自封”了。这种“急功近利”的做法，瞬间让OpenAI“失了民心”，不少网友都在吐槽这是“大型社死现场”**。

当然，OpenAI也不甘示弱，Naom Brown代表OpenAI连发数推**“自证清白”。他先是肯定了GDM的成就，然后“澄清”说，IMO组委会曾邀请他们参与基于Lean语言的正式竞赛，但OpenAI当时正忙于自然语言通用推理研究，所以就“婉拒了”。他还特别强调，他们的通用模型参赛时没有使用任何RAG等工具**，提交的证明都由三位外部IMO奖牌获得者评分，而且**“完全一致”**。[2]

更有甚者，另一位OpenAI研究员Aidan McLaughlin直接**“阴阳怪气”地讥讽GDM，“他们为模型提供上下文，纯属带着小抄进入了考场作弊”。好家伙，这不就是“狗咬狗一嘴毛”，“AI界宫斗剧”**的既视感吗？

但事实摆在眼前：一边是谷歌DeepMind经过IMO官方认证、未来可用的模型；一边是OpenAI不讲武德、提前邀功、模型版本未公开且很可能不会公开的**“空中楼阁”。这轮“AI奥数PK”**，高下立判。

未来预测：AI+数学，会擦出怎样的火花？

抛开这场“神仙打架”的吃瓜大戏，我们更应该看到，AI在数学领域的突破，绝不仅仅是一个金牌那么简单。

谷歌DeepMind长期以来都与数学界保持着紧密的合作，而AI为数学做出贡献的潜力，才刚刚**“露出尖尖角”。通过训练Gemini学会更灵活、更直观地推理，谷歌正一步步构建出能够解决更复杂、更前沿数学问题的AI。这不仅能帮助人类数学家“降维打击”那些看似“无解”的难题，甚至可能在基础科学研究中扮演“关键先生”**的角色。

谷歌坚信，那些能够将流畅的自然语言能力与严谨的推理能力（包括形式化语言中的可验证推理）相结合的AI智能体，将成为数学家、科学家、工程师和研究人员不可或缺的“左膀右臂”。在通往AGI（通用人工智能）的道路上，AI不再仅仅是“工具人”，它将成为推动人类知识进步的**“加速器”**。

或许在不久的将来，你的数学老师会让你用AI辅助完成作业；或许那些困扰人类百年之久的数学猜想，会在某个AI的**“灵光一闪”中被破解。想想看，这难道不比追剧更刺激**吗？

引用

Advanced version of Gemini with Deep Think officially achieves gold medal standard at the International Mathematical Olympiad·Google DeepMind Blog·（2025/7/22）·检索日期2025/7/22 ↩︎ ↩︎ ↩︎
IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”，网友·华尔街见闻·（2025/7/22）·检索日期2025/7/22 ↩︎