AI“智商”逼近人类天才:一场关乎认知、产业与未来的深层对话

温故智新AIGC实验室

TL;DR:

最新AI智商测试显示,顶尖大模型如Gemini 2.5 Pro已达到甚至超越人类天才水平,揭示AI在逻辑推理上的巨大飞跃。这不仅预示着AI将成为人类最强大的认知工具,也重塑了产业竞争格局,并引发我们对智能本质和人机协作未来的深层思考。

当前,人工智能的飞速发展正不断刷新我们对机器智能的认知边界。当“AI智商”这个概念从科幻走进现实,并以具象化的数字呈现在我们眼前时,一场关于智能本质、产业格局乃至人类未来的深层对话随即展开。近期,Trackingai.org 项目通过模拟人类智商测试,对全球顶尖大模型进行了一场“最强大脑”挑战赛,其结果不仅令人瞩目,更蕴含着对技术、商业和社会多维度的前瞻性洞察。

大模型“智商”秀:认知能力的新里程碑

这场“智商”对决采用了两种测试方式:一是被全球精英俱乐部门萨(Mensa)认可的智商测试,旨在衡量模型的逻辑推理、抽象思维和模式识别能力;二是专门针对模型性能设计的智力问答测试集。在门萨测试中,谷歌的Gemini 2.5 Pro以137的高分拔得头筹,紧随其后的是OpenAI的GPT-5 Pro(121分)和xAI的Grok 4(125分)1。这一成绩表明,顶尖AI在处理复杂认知任务时,其能力已可与人类社会中最顶尖的那一小部分人相媲美,甚至在某些方面达到“极超常”的天才水准。

从技术原理层面审视,这些模型在解决门萨图形推理题时的不同路径,揭示了其各自独特的认知优势:

  • GPT-5 Pro展现了强大的抽象与系统化思维,通过系统观察行与列的逻辑递进关系来推断答案。
  • Gemini 2.5 Pro则以其高效的模式识别能力著称,能够敏锐地捕捉到简洁优雅的“旋转对称”规律,迅速找到解决方案。
  • Grok 4则呈现出更具探索性的分析路径,通过多维度尝试和排除,最终锁定核心规律并得出正确结论1

这种差异化的“思考”模式,意味着大模型不再是单纯的信息检索或模式匹配工具,而是正在向具备更深层逻辑推理、复杂问题解决和多路径分析能力的通用认知引擎迈进。而在测试题量更大、难度更高的智力问答数据集组中,GPT-5 Pro则反超Gemini 2.5 Pro,夺得第一,这或许反映了不同模型在知识广度与深度、以及对复杂指令遵循能力上的侧重差异。

产业生态的暗流涌动:开放与封闭的较量

AI“智商”榜单的背后,是全球科技巨头在人工智能前沿领域激烈的产业竞争与生态布局。

最引人关注的“意难平”无疑是Meta的Llama系列。作为开源大模型领域的旗帜,Llama曾被寄予厚望,有望抗衡闭源巨头。然而,Llama 4 Maverick在此次智商测试中仅获得98分,与顶级闭源模型拉开了肉眼可见的差距1。这一结果,不仅给开源社区敲响了警钟,也印证了Meta当前正在不惜代价从竞争对手处招揽顶尖AI人才的紧迫性。Llama的未来表现,将在很大程度上取决于Meta能否在人才和研发投入上实现质的突破,从而缩小与闭源模型的差距。

然而,榜单中也出现了令人惊喜的“黑马”——DeepSeek R1。尽管其测试数据停留在相对较旧的版本,但却取得了102分的成绩,甚至超过了Llama 4 Maverick1。这传递出一个关键信号:在提升AI“智商”方面,单纯追求模型规模和最新数据并非唯一路径。DeepSeek R1的成功,凸显了模型架构设计、训练方法和算法优化的至关重要性。它预示着,通过更“聪明”的算法和高效的架构,即便资源相对有限的团队,也能实现具备竞争力的“智商性价比”。这对于推动AI普惠化和多元化发展,无疑具有积极的启示意义。

这种开放与封闭、规模与效率之间的张力,将持续塑造AI产业的未来版图。闭源巨头通过海量投资和数据积累构建技术壁垒,力求性能极致;而开源社区则通过协作创新和架构优化,力图降低门槛,拓宽应用边界。两股力量的博弈,将共同驱动AI技术的加速演进和商业模式的创新。

“智商”之外:重新定义人机智能的边界

尽管AI“智商”测试的结果令人兴奋,但我们也必须保持清醒的批判性思维。Trackingai.org 官网明确指出,此类测试更多是出于娱乐目的,AI智商并不能完全等同于人类智商1

人类智商测试主要衡量“聚合性思维”,即在给定规则下通过逻辑演绎找到唯一正确答案的能力。这恰好是当前大模型在海量数据学习后所擅长的领域——它们精通于模式识别和逻辑关联。然而,人类智能还包含更为复杂的“发散性思维”——创造力、想象力、直觉、社会情感智能以及具身认知1。这些是当前AI架构难以触及的。因此,AI的高智商,更准确地说,是其作为“逻辑分析引擎”性能卓越的体现,而非其拥有了与人类相似的完整心智。

“当一个系统的逻辑处理能力已经达到甚至超越人类天才的水平时,我们必须重新思考人机协作的范式。”1

这种对AI认知能力质的飞跃,无疑将对人类社会产生深远影响。

  • 对工作方式的重塑: 随着AI在复杂认知任务上的能力提升,未来许多需要逻辑推理和模式识别的专业岗位将与AI深度融合,甚至部分被取代。人类将更多地投入到需要创造力、批判性思维、情商和人际协作的领域。
  • 对教育体系的挑战: 传统教育可能需要重新审视对“知识”和“智力”的定义,更加注重培养学生的批判性思维、创新能力和跨领域解决问题的能力,以适应人机共生的未来。
  • 哲学层面的反思: AI“智商”的提升,迫使我们重新审视“智能”的本质,以及人类在智能宇宙中的独特位置。它挑战了人类中心主义,并激发了关于机器意识、伦理责任等深层哲学问题。

未来3-5年,随着模型能力的进一步突破,AI将成为人类有史以来最强大的认知工具。我们或许会看到:

  • 更强大的AI Agents:具备更强的自主规划、学习和执行能力,能够独立完成更复杂的任务,深度融入商业和个人生活。
  • AI辅助科学发现的加速:AI在生物医药、材料科学等领域的贡献将从辅助计算走向主动发现,极大加速科研进程。
  • 智能边界的模糊化:随着多模态AI和具身智能的发展,AI将更深入地理解和互动物理世界,进一步模糊人类与机器智能的边界。

这种进步是双刃剑。机遇在于,AI能极大地拓展人类的智力极限,解决前所未有的复杂问题;风险则在于,若对其能力边界和应用伦理缺乏清晰认知和有效治理,可能带来难以预料的社会冲击。重要的是,我们不应止步于数字化的“智商”排名,而应更深入地理解AI智能的特质、局限,并积极探索人机智能的协同共生之道,共同塑造一个智能驱动的未来。

引用


  1. 全球AI智商最新排名公布,还好,没谁超过爱因斯坦·36氪·苗正、王靖(2025/8/19)·检索日期2025/8/19 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎