TL;DR:
谷歌Gemini AI在国际奥数竞赛(IMO)上真的拿了官方认证金牌,直接把隔壁OpenAI之前"自宣"的成绩衬托成了大型"社死"现场。这波操作,谷歌不仅秀了肌肉,还给AI大模型的数学推理能力开辟了新赛道,顺便狠狠“打脸”了竞争对手!
嘿,各位吃瓜群众,科技圈最近上演了一出“宫斗大戏”!这不,国际奥林匹克数学竞赛(IMO)的“金牌榜”刚揭晓,最“靓的仔”竟然不是哪位少年天才,而是谷歌DeepMind旗下的AI——Gemini!它不仅一举斩获官方认证的IMO金牌,还以35分(满分42分,答对6题中的5题)的傲人成绩,让整个硅谷都“夹道祝贺”,连马斯克都忍不住点赞。1
这事儿本来挺喜庆,但“有人欢喜有人愁”啊。同样宣称在IMO拿了金牌的OpenAI,这下可就尴尬了,简直是“大型社死现场”。为啥呢?咱们接着往下看。
AI奥数“神仙打架”:谷歌Gemini的“金牌凡尔赛”
想象一下,一场全球顶尖的“脑力奥运会”,人类选手们在考场上抓耳挠腮、冥思苦想。而隔壁,一位名叫Gemini的AI选手,在短短4.5小时内,轻松搞定6道难题中的5道,拿下了含金量十足的“金牌”。是不是万万没想到?
要知道,去年DeepMind的AI还在IMO拿了块银牌,用了足足三天时间,而且还得把题目格式“翻译”一下才能理解。这回,Gemini直接“脱胎换骨”,不仅用时大幅缩短,全程还是自然语言、端到端完成,简直是“无障碍交流”。DeepMind的高级科学家Thang Luong都忍不住感叹,这简直是“范式转变”!2
更有意思的是,在今年的第三题,不少人类选手得动用研究生级别的数学知识才能解,结果咱们Gemini,仅仅凭借初等数论知识就给出了清晰、自洽的证明。这波操作,简直就是“降维打击”!3
那么问题来了,这AI到底是怎么做到的? DeepMind透露,这次立下赫赫战功的是Gemini的一个“进阶版本”,搭载了全新的**“Deep Think”推理模式**。这玩意儿可不简单,它能让模型同时探索多种可能的解决方案,不像以前那样一条道走到黑。简单来说,就是AI学会了“多线程思考”,而且还给它喂了海量的多步推理、问题求解和定理证明数据。用哈萨比斯的话说,这模型未来会开放给Google AI Ultra的订阅用户——“有钱人的快乐,你想象不到”。3
“隔壁老王”OpenAI的“尴尬时间”:到底谁才是“真金白银”?
这边谷歌DeepMind风光无限,那边OpenAI的Sam Altman最近可有点“上头条”——但都不是啥好事儿。为啥谷歌被硅谷“夹道欢迎”,而OpenAI却“脸面无光”呢?
原因嘛,说来话长,但核心就俩字:“体面”。
谷歌这次参加IMO挑战,是受到了官方邀请,所有规则、时间、评分标准都和人类选手一模一样,而且还严格遵守了IMO官方的要求,没有抢在颁奖典礼前“抢跑”宣布成绩。DeepMind CEO哈萨比斯发推特,字里行间虽然没提OpenAI,但处处都在“内涵”:“我们的官宣没抢跑,成绩是IMO认证的,模型也是未来可用的!” 每一句话,都像是一记响亮的耳光,打在了OpenAI的脸上。1
因为就在谷歌“官宣”前几天,OpenAI就“迫不及待”地跳出来,“自宣”自家AI也拿了IMO金牌。结果呢?IMO评审团和协调员们直接开怼,直言AI开发商在IMO期间宣布成绩是“粗鲁且不恰当的”。更要命的是,OpenAI这枚“金牌”的“含金量”也备受质疑:
- 官方认证?不存在的。 DeepMind的科学家就说了,IMO有内部评分指南,外部无法获取,没有基于这套指南的评分,哪来的“奖牌”一说?
- 分数悬疑。 IMO金牌线是35分,OpenAI自报的成绩也刚好卡线。要知道,奥数评分扣分很严,哪怕一点点瑕疵,都可能从金牌变银牌。
- 模型神秘。 OpenAI参赛的模型也是“未公开版本”,甚至可能永远不公开,让人有点“玩不起”的感觉。
有网友直接开嘲讽:“OpenAI一如既往的为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。” 这波吐槽,真是“杀人诛心”!
当然,OpenAI研究员Noam也跳出来“回应质疑”了。他表示,OpenAI没和IMO官方合作,不是没收到邀请,是他们自己拒绝了。至于评分嘛,那是请了3位IMO获奖者给出的,而且解题过程也公开了,“爱信不信,反正我公开了!” 至于“抢跑”时间,Noam解释说,他们公布成绩前跟IMO董事会沟通过,对方要求颁奖后发,而OpenAI发布时“太平洋时间凌晨1点,颁奖已结束,没有被要求更晚发布。”4
尽管OpenAI极力解释,但网友们的心嘛,还是更偏向于谷歌这边。毕竟,谷歌这波操作是既“秀”了技术,又“秀”了“情商”,堪称教科书级别的“体面”。
深层思考:这场“奥数战役”的AI新赛点
这场AI大模型的“奥数金牌争夺战”,可不只是两家巨头“隔空互怼”那么简单,它折射出了AI领域几个深层次的趋势和挑战:
- AI推理能力的飞跃。 过去我们总说AI擅长大数据分析,但在复杂、抽象的数学推理上还有欠缺。Gemini的“Deep Think”模式,特别是“并行思维”的引入,无疑是AI走向更高级认知能力的里程碑。这预示着未来AI将在科学研究、复杂系统设计等领域发挥更大作用。
- “黑盒”与“透明”的博弈。 谷歌选择公开解题过程,并获得官方认证,这种“透明”和“权威”赢得了信任。而OpenAI的“非官方”路径和“半遮半掩”的模型细节,则让人对AI的评估标准和可信度产生了疑问。未来AI的信任危机,可能就藏在这些“细节”里。
- 竞争格局的白热化。 从ChatGPT横空出世,到如今Gemini在奥数赛场“一鸣惊人”,谷歌和OpenAI之间的“擂台赛”越来越精彩。这不仅是技术实力的比拼,更是市场策略、公关能力、乃至行业“话语权”的全面较量。谁能笑到最后,还得看谁的“牌”打得更妙。
总之,这场AI界的“奥数风云”,不仅是技术突破的展示,更是一次生动的“商业伦理课”和“品牌公关课”。未来的AI,不仅要能干,还得干得“漂亮”,干得“体面”。至于奥特曼嘛……最近确实有点“水逆”啊!
引用
-
Demis Hassabis推文·X·Demis Hassabis(2025/7/22)·检索日期2025/7/22 ↩︎ ↩︎
-
Google DeepMind earns gold in International Math Olympiad with new Gemini AI·Ars Technica·Benj Edwards(2025/7/22)·检索日期2025/7/22 ↩︎
-
全球首个IMO金牌AI诞生,谷歌Gemini碾碎奥数神话·36氪·关注前沿科技(2025/7/22)·检索日期2025/7/22 ↩︎ ↩︎
-
Noam Brown推文·X·Noam Brown(2025/7/22)·检索日期2025/7/22 ↩︎