TL;DR:
各位看官,瓜来了! 谷歌Gemini Deep Think在奥数界直接封神,拿下IMO金牌,还是官方认证的!这边厢OpenAI却因为“自宣”夺金,被啪啪打脸,大型社死现场,这波AI奥数之战,精彩到堪比神仙打架!
今天,科技圈又炸了锅!不是因为哪个新手机发布,也不是哪个大佬又说了什么金句,而是因为——AI,这个**“学霸”人设越发稳固的家伙,居然在国际数学奥林匹克竞赛(IMO)上,真的拿下金牌了!而且,是那种货真价实、官方盖章、童叟无欺的“金牌认证”。主角就是谷歌DeepMind旗下的Gemini Deep Think**,这波操作,直接把AI在数学推理领域的上限又拉高了一大截,也让友商OpenAI有点坐不住了,一场“AI奥数之争”的年度大戏,正式进入高潮。
碾压奥数神话:Gemini Deep Think的“神来之笔”
你以为奥数只是那些**“天选之子”的专属领域?那你就错了!现在,AI也来搅局了。国际数学奥林匹克竞赛,简称IMO,那可是全球数学界的“华山论剑”,自1959年起每年举办一次,汇聚了全球最顶尖的数学天才。它不光考验你的逻辑推理,还特别“刁钻”,看你的创造性思维和严谨性够不够格。能拿到金牌的,那都是选手中的“卷王”**,比例仅占前8%。
然而,就在这个人类智慧的竞技场上,谷歌DeepMind的Gemini Deep Think(高级版)却用它那**“开挂”**般的表现,震惊了所有人。在短短4.5小时内,它成功攻克了6道题中的5道,狂揽35分(满分42分),一举达到IMO金牌标准!1
更让人拍案叫绝的是,Gemini全程仅使用纯自然语言——英语来完成解题。这和之前一些AI模型需要将问题“翻译”成复杂的**“形式语言”(比如Lean)才能处理完全不同。你想想,这不就像一个学霸,别人还得带着厚厚的参考书,他却直接用“大白话”就把最难的题解了,而且还解得思路清晰、表述精确**,连IMO主席Gregor Dolinar教授都忍不住夸赞:“这些解法在诸多方面都堪称惊艳。”1
这波操作,不禁让人想起图灵奖得主Karpathy的**“神预言”**:“英语是热门的编程语言”。如今看来,诚不我欺!
技术大揭秘:这玩意儿到底怎么工作的?
那么,这个“别人家的孩子”——Gemini Deep Think,是如何做到如此逆天的呢?
谷歌DeepMind团队透露,他们使用了Gemini Deep Think的高级版本,一种针对复杂问题设计的增强推理模式。这套系统,简直就是给AI开了“多核CPU”:
- 并行思考技术:它不是那种“一条道走到黑”的AI,而是能同时探索多种解题路径,就像一个人脑子里住着好几个顶尖数学家,各司其职,最后还能**“合议”出最优解。这种“多线程推理”**,彻底突破了传统单一线性思考的局限。
- 强化学习训练:为了让Gemini更“聪明”,谷歌还对它进行了新颖的强化学习训练,用海量的多步推理、问题解决和定理证明数据给它**“喂饭”**,让它吃得饱,长得壮。
- “考前辅导”秘籍:除了这些“硬核”技术,团队还很“贴心”地给Gemini提供了更多思考时间、过往高质量解决方案集,以及解决IMO问题的通用提示与技巧。这套**“训练+知识库+策略”的组合拳,直接把Gemini送上了IMO的“C位”**!
想象一下,这就像给你的大脑装上了**“无限算力”和“百科全书”**,还能帮你整理出“考试重点”,这谁顶得住啊!
值得一提的是,这款**“学霸版”Deep Think模型,谷歌接下来会优先给一部分数学家等测试者使用,然后嘛,就会向Google AI Ultra订阅者推出。各位“吃瓜群众”**,未来离AI帮你解数学题的日子,可能真的不远了。
行业“地震”:谁笑了谁哭了?OpenAI的“自封金牌”风波
就在谷歌DeepMind高调官宣IMO金牌的当口,隔壁的OpenAI估计有点**“破防了”。因为就在几天前,OpenAI也抢先一步,对外宣称自己的模型在IMO竞赛中获得了相当于金牌的成绩。结果呢?这一消息迅速演变成了一场巨大的争议风波**,核心问题就是:它的金牌,不是官方认证的![1]
谷歌DeepMind的负责人Demis Hassabis连发两弹,一再强调“谷歌模型是首个获得官方金牌级别认可的AI系统”1。IMO组委会也“亲自下场”打脸OpenAI,明确表示“OpenAI并不是与IMO合作测试模型的AI公司之一,91位IMO官方评委中没有任何人参与评估他们的答卷。这意味着,OpenAI的‘金牌’成绩完全是自说自话,没有经过官方认证。”2
更有意思的是,谷歌DeepMind超级推理团队的Thang Luong还爆料,IMO组委会其实特地明确要求,希望各大模型公司在闭幕式一周后再公布成绩,不要抢走“孩子们”的风头。结果OpenAI不仅不讲武德**“提前抢跑”,还把一个没有经过官方评分的金牌“自封”了。这种“急功近利”的做法,瞬间让OpenAI“失了民心”,不少网友都在吐槽这是“大型社死现场”**。
当然,OpenAI也不甘示弱,Naom Brown代表OpenAI连发数推**“自证清白”。他先是肯定了GDM的成就,然后“澄清”说,IMO组委会曾邀请他们参与基于Lean语言的正式竞赛,但OpenAI当时正忙于自然语言通用推理研究,所以就“婉拒了”。他还特别强调,他们的通用模型参赛时没有使用任何RAG等工具**,提交的证明都由三位外部IMO奖牌获得者评分,而且**“完全一致”**。[2]
更有甚者,另一位OpenAI研究员Aidan McLaughlin直接**“阴阳怪气”地讥讽GDM,“他们为模型提供上下文,纯属带着小抄进入了考场作弊”。好家伙,这不就是“狗咬狗一嘴毛”,“AI界宫斗剧”**的既视感吗?
但事实摆在眼前:一边是谷歌DeepMind经过IMO官方认证、未来可用的模型;一边是OpenAI不讲武德、提前邀功、模型版本未公开且很可能不会公开的**“空中楼阁”。这轮“AI奥数PK”**,高下立判。
未来预测:AI+数学,会擦出怎样的火花?
抛开这场“神仙打架”的吃瓜大戏,我们更应该看到,AI在数学领域的突破,绝不仅仅是一个金牌那么简单。
谷歌DeepMind长期以来都与数学界保持着紧密的合作,而AI为数学做出贡献的潜力,才刚刚**“露出尖尖角”。通过训练Gemini学会更灵活、更直观地推理,谷歌正一步步构建出能够解决更复杂、更前沿数学问题的AI。这不仅能帮助人类数学家“降维打击”那些看似“无解”的难题,甚至可能在基础科学研究中扮演“关键先生”**的角色。
谷歌坚信,那些能够将流畅的自然语言能力与严谨的推理能力(包括形式化语言中的可验证推理)相结合的AI智能体,将成为数学家、科学家、工程师和研究人员不可或缺的“左膀右臂”。在通往AGI(通用人工智能)的道路上,AI不再仅仅是“工具人”,它将成为推动人类知识进步的**“加速器”**。
或许在不久的将来,你的数学老师会让你用AI辅助完成作业;或许那些困扰人类百年之久的数学猜想,会在某个AI的**“灵光一闪”中被破解。想想看,这难道不比追剧更刺激**吗?
引用
-
Advanced version of Gemini with Deep Think officially achieves gold medal standard at the International Mathematical Olympiad·Google DeepMind Blog·(2025/7/22)·检索日期2025/7/22 ↩︎ ↩︎ ↩︎
-
IMO怒斥OpenAI自封夺金,“91位评委均未参与评分”,网友·华尔街见闻·(2025/7/22)·检索日期2025/7/22 ↩︎