AI奥数金牌战：谷歌Gemini真香，OpenAI惨遭“社死”现场？

TL;DR：

谷歌Gemini AI在国际奥数竞赛（IMO）上真的拿了官方认证金牌，直接把隔壁OpenAI之前"自宣"的成绩衬托成了大型"社死"现场。这波操作，谷歌不仅秀了肌肉，还给AI大模型的数学推理能力开辟了新赛道，顺便狠狠“打脸”了竞争对手！

嘿，各位吃瓜群众，科技圈最近上演了一出“宫斗大戏”！这不，国际奥林匹克数学竞赛（IMO）的“金牌榜”刚揭晓，最“靓的仔”竟然不是哪位少年天才，而是谷歌DeepMind旗下的AI——Gemini！它不仅一举斩获官方认证的IMO金牌，还以35分（满分42分，答对6题中的5题）的傲人成绩，让整个硅谷都“夹道祝贺”，连马斯克都忍不住点赞。¹

这事儿本来挺喜庆，但“有人欢喜有人愁”啊。同样宣称在IMO拿了金牌的OpenAI，这下可就尴尬了，简直是“大型社死现场”。为啥呢？咱们接着往下看。

AI奥数“神仙打架”：谷歌Gemini的“金牌凡尔赛”

想象一下，一场全球顶尖的“脑力奥运会”，人类选手们在考场上抓耳挠腮、冥思苦想。而隔壁，一位名叫Gemini的AI选手，在短短4.5小时内，轻松搞定6道难题中的5道，拿下了含金量十足的“金牌”。是不是万万没想到？

要知道，去年DeepMind的AI还在IMO拿了块银牌，用了足足三天时间，而且还得把题目格式“翻译”一下才能理解。这回，Gemini直接“脱胎换骨”，不仅用时大幅缩短，全程还是自然语言、端到端完成，简直是“无障碍交流”。DeepMind的高级科学家Thang Luong都忍不住感叹，这简直是“范式转变”！²

更有意思的是，在今年的第三题，不少人类选手得动用研究生级别的数学知识才能解，结果咱们Gemini，仅仅凭借初等数论知识就给出了清晰、自洽的证明。这波操作，简直就是“降维打击”！³

那么问题来了，这AI到底是怎么做到的？ DeepMind透露，这次立下赫赫战功的是Gemini的一个“进阶版本”，搭载了全新的**“Deep Think”推理模式**。这玩意儿可不简单，它能让模型同时探索多种可能的解决方案，不像以前那样一条道走到黑。简单来说，就是AI学会了“多线程思考”，而且还给它喂了海量的多步推理、问题求解和定理证明数据。用哈萨比斯的话说，这模型未来会开放给Google AI Ultra的订阅用户——“有钱人的快乐，你想象不到”。³

“隔壁老王”OpenAI的“尴尬时间”：到底谁才是“真金白银”？

这边谷歌DeepMind风光无限，那边OpenAI的Sam Altman最近可有点“上头条”——但都不是啥好事儿。为啥谷歌被硅谷“夹道欢迎”，而OpenAI却“脸面无光”呢？

原因嘛，说来话长，但核心就俩字：“体面”。

谷歌这次参加IMO挑战，是受到了官方邀请，所有规则、时间、评分标准都和人类选手一模一样，而且还严格遵守了IMO官方的要求，没有抢在颁奖典礼前“抢跑”宣布成绩。DeepMind CEO哈萨比斯发推特，字里行间虽然没提OpenAI，但处处都在“内涵”：“我们的官宣没抢跑，成绩是IMO认证的，模型也是未来可用的！” 每一句话，都像是一记响亮的耳光，打在了OpenAI的脸上。¹

因为就在谷歌“官宣”前几天，OpenAI就“迫不及待”地跳出来，“自宣”自家AI也拿了IMO金牌。结果呢？IMO评审团和协调员们直接开怼，直言AI开发商在IMO期间宣布成绩是“粗鲁且不恰当的”。更要命的是，OpenAI这枚“金牌”的“含金量”也备受质疑：

官方认证？不存在的。 DeepMind的科学家就说了，IMO有内部评分指南，外部无法获取，没有基于这套指南的评分，哪来的“奖牌”一说？
分数悬疑。 IMO金牌线是35分，OpenAI自报的成绩也刚好卡线。要知道，奥数评分扣分很严，哪怕一点点瑕疵，都可能从金牌变银牌。
模型神秘。 OpenAI参赛的模型也是“未公开版本”，甚至可能永远不公开，让人有点“玩不起”的感觉。

有网友直接开嘲讽：“OpenAI一如既往的为了炒作什么都干得出来。没有官方分数，没有耐心，也没有羞耻心。” 这波吐槽，真是“杀人诛心”！

当然，OpenAI研究员Noam也跳出来“回应质疑”了。他表示，OpenAI没和IMO官方合作，不是没收到邀请，是他们自己拒绝了。至于评分嘛，那是请了3位IMO获奖者给出的，而且解题过程也公开了，“爱信不信，反正我公开了！” 至于“抢跑”时间，Noam解释说，他们公布成绩前跟IMO董事会沟通过，对方要求颁奖后发，而OpenAI发布时“太平洋时间凌晨1点，颁奖已结束，没有被要求更晚发布。”⁴

尽管OpenAI极力解释，但网友们的心嘛，还是更偏向于谷歌这边。毕竟，谷歌这波操作是既“秀”了技术，又“秀”了“情商”，堪称教科书级别的“体面”。

深层思考：这场“奥数战役”的AI新赛点

这场AI大模型的“奥数金牌争夺战”，可不只是两家巨头“隔空互怼”那么简单，它折射出了AI领域几个深层次的趋势和挑战：

AI推理能力的飞跃。 过去我们总说AI擅长大数据分析，但在复杂、抽象的数学推理上还有欠缺。Gemini的“Deep Think”模式，特别是“并行思维”的引入，无疑是AI走向更高级认知能力的里程碑。这预示着未来AI将在科学研究、复杂系统设计等领域发挥更大作用。
“黑盒”与“透明”的博弈。 谷歌选择公开解题过程，并获得官方认证，这种“透明”和“权威”赢得了信任。而OpenAI的“非官方”路径和“半遮半掩”的模型细节，则让人对AI的评估标准和可信度产生了疑问。未来AI的信任危机，可能就藏在这些“细节”里。
竞争格局的白热化。 从ChatGPT横空出世，到如今Gemini在奥数赛场“一鸣惊人”，谷歌和OpenAI之间的“擂台赛”越来越精彩。这不仅是技术实力的比拼，更是市场策略、公关能力、乃至行业“话语权”的全面较量。谁能笑到最后，还得看谁的“牌”打得更妙。

总之，这场AI界的“奥数风云”，不仅是技术突破的展示，更是一次生动的“商业伦理课”和“品牌公关课”。未来的AI，不仅要能干，还得干得“漂亮”，干得“体面”。至于奥特曼嘛……最近确实有点“水逆”啊！

引用

Demis Hassabis推文·X·Demis Hassabis（2025/7/22）·检索日期2025/7/22 ↩︎ ↩︎
Google DeepMind earns gold in International Math Olympiad with new Gemini AI·Ars Technica·Benj Edwards（2025/7/22）·检索日期2025/7/22 ↩︎
全球首个IMO金牌AI诞生，谷歌Gemini碾碎奥数神话·36氪·关注前沿科技（2025/7/22）·检索日期2025/7/22 ↩︎ ↩︎
Noam Brown推文·X·Noam Brown（2025/7/22）·检索日期2025/7/22 ↩︎