德米斯·哈萨比斯:在游戏与世界模型间丈量AGI的星辰大海

温故智新AIGC实验室

TL;DR:

德米斯·哈萨比斯,DeepMind的掌舵者,将游戏视为通往通用人工智能(AGI)的“试金石”。他不仅通过“世界模型”Genie 3让AI理解物理现实,更以Game Arena为平台,探索AI自创游戏并相互教学的未来,旨在构建能够理解人类目标、不断自我演进的完整智能系统。

在人工智能浪潮席卷全球的当下,少数杰出思想者的洞察力,如同黑夜中的灯塔,指引着行业的前进方向。德米斯·哈萨比斯(Demis Hassabis),这位Google DeepMind的首席执行官,不仅因其在AI领域的开创性贡献而享誉世界,更以其深邃的思考和对通用人工智能(AGI)的执着追求,在科技界独树一帜。他的人生轨迹,从一个国际象棋神童,到游戏设计者,再到顶尖AI科学家和企业领袖,每一步都似乎在为理解智能的本质、构筑未来的AI系统奠定基石。近期,在一次深入的访谈中,哈萨比斯再次展露了他对AGI演进路径的独特视角,以及DeepMind如何以游戏为“试金石”,步步为营地探索智慧的边界。

游戏:从启蒙到丈量AGI的“试金石”

对哈萨比斯而言,游戏不仅是娱乐,更是AI算法思想进化的最佳训练场与客观评估基准。他早期的经历,从国际象棋赛场上的运筹帷幄,到共同创立游戏公司,无疑为他日后将游戏作为AI研究的核心载体埋下了伏笔。他坚信,在纯粹而规则明确的游戏环境中,AI能够得到最真实、最科学的性能衡量。

这种信念,在Google DeepMind与Kaggle合作推出的Game Arena测试平台中得到了最新体现。哈萨比斯指出,当前AI系统普遍存在一种“锯齿智能”现象——它们或许能在国际数学奥林匹克竞赛中摘金夺银,却可能在简单的日常逻辑或特定游戏中犯下小学生都不会犯的错误1。这种能力的“不一致性”,是AGI发展道路上亟待突破的关键障碍。

Game Arena的设计,正是为了克服现有基准测试的局限性。“这些benchmark正迅速达到饱和,甚至可能因测试本身的误差影响评估效果,”哈萨比斯强调,“我们需要更难、更广泛的benchmark,涵盖物理世界理解、直觉物理、物理智能及安全特性等维度。”1

Game Arena的优势在于其动态适应性:它允许最优秀的模型相互竞争,随着AI系统能力的提升,游戏难度可自动调整。更具前瞻性的是,哈萨比斯预见了一个终极场景:“或许最终AI系统应该能发明自己的游戏,然后教给其他AI系统,让它们去学习,就像是学习一个从未存在过的新游戏,这样就不可能出现过度拟合训练数据之类的情况了。”1 这不仅是对AI通用学习能力的终极检验,也展现了他对未来多智能体(multi-agent)环境的深刻构想。

构筑“世界模型”:AI理解现实的基石

如果说游戏是AI智能成长的沃土,那么对“世界模型”的构建,则是哈萨比斯认为AI真正迈向AGI的现实根基。他反复强调一个核心理念:“人类不仅生活在语言和数学世界中,更身处物理世界中。”1 若AGI想要真正发挥作用,无论是驱动机器人,还是成为日常生活的智能助手,都离不开对物理世界规律的深刻理解——包括物理结构、材料特性、液体流动、生物行为等。

Genie 3,作为DeepMind多个研究分支融合的成果,正是构建这种“世界模型”的核心尝试。它利用3D游戏引擎等模拟环境生成海量数据,让AI在虚拟场景中学习现实世界的规律。Genie 3最显著的特点在于其能够生成具有“一致性”的世界:当用户暂时离开虚拟场景再返回时,场景状态与离开时保持一致,例如“打开水龙头会有液体流出”“镜子能反射出影像”等逻辑都能在生成过程中得到体现1。这证明了Genie 3并非随机生成内容,而是对世界运作建立了稳定的底层模型。

令人惊叹的是,Genie 3已应用于内部训练中,实现了“一个AI在另一个AI的头脑中进行游戏”的闭环。DeepMind的游戏Agent SIMA,可以直接操控并玩现有的电脑游戏。当SIMA被放入Genie 3创建的世界中,SIMA决定行动,Genie 3则实时生成对应的环境变化。这种模式能为机器人技术和AGI系统训练创建无限的训练数据,其在互动娱乐领域的潜在价值,更可能催生介于电影与游戏之间的新型娱乐形式。从科学视角看,哈萨比斯认为,这为探索现实本质提供了新维度——“通过AI对世界的模拟与生成,人类得以从不同角度思考‘现实的本质’。”1

“北极星”的指引:AGI的人性化边界

当AI的能力日益逼近通用智能的彼岸,一个更深层次的挑战浮出水面:如何在复杂且混乱的现实世界中,为AI定义并优化其“奖励函数”或“目标函数”?强化学习领域长期面临的这一难题,在哈萨比斯看来,在人类世界中变得尤为复杂。

“在人类世界里,没有单一的目标函数,情况非常复杂。人是多目标的,会根据其他状态,比如情绪状态、物理环境以及在职业生涯中的位置等所有这些因素,不断地调整不同目标的权重。”1 尽管如此,他坚信,人类凭借自身的智慧,总能大致弄清楚正确的“北极星”是什么,从而度过难关。

哈萨比斯认为,未来的通用系统也必须做到这一点:它们要学会理解人类用户想要实现的目标,然后弄清楚如何将其转化为一组有用的奖励函数来进行优化1。这不仅是技术层面的挑战,更是对AI伦理与对齐(Alignment)的深刻思考——如何确保强大的AGI系统,其目标函数能够与人类的价值观、福祉和复杂需求保持一致,这将是定义其“人性化边界”的关键。

走向“完整系统”:思考与工具的融合

哈萨比斯还勾勒了AI从单纯的“权重模型”向更复杂的“完整系统”演进的路径。他强调,“思考模型”(Thinking models)的演进是一个重要方向,以Deep Think为代表的系统,延续了AlphaGo等早期游戏AI中基于Agent的系统思路,重点关注AI的思考、规划与推理能力2。这类系统能够进行深度思考和并行规划,在数学、编程、科学问题等领域,通过反复推演优化结果,而非直接输出初始结论。他认为,这是实现AGI的必要路径。

同时,“工具使用”成为AI能力扩展的新维度。思考模型在推理过程中可以调用搜索功能、数学程序、编码工具等,并据此更新规划方案1。对于数字系统而言,“工具”与“主模型能力”的边界可能模糊不清,但核心原则在于:若某种能力有助于提升其他能力,则应整合入主模型;反之,则考虑作为工具调用。

这种从简单输入输出模型向能结合工具使用、规划与思考能力的“完整系统”的转变,对产品设计提出了前瞻性要求。哈萨比斯表示,DeepMind的产品设计需要预判一年后的技术水平,并允许底层引擎定期更新,以适应技术的快速迭代1

德米斯·哈萨比斯,这位在DeepMind高歌猛进的首席执行官,不仅在推动AI技术的前沿突破,更在以一种融合了科学、哲学与人文关怀的方式,描绘着AGI的未来图景。从游戏的方寸之地,到世界模型的广阔视野,再到对人类“北极星”的深邃追问,他所筑建的不仅是代码与算法的堡垒,更是对智能与存在本质的无尽探索。他的每一步,都在邀请我们共同思考:当AI学会创造和教学,当它真正理解现实与人类目标,我们离那个能够自主思索、理解并服务于人类的通用智能,还有多远?而他,无疑是这场伟大征程中,最坚定的引路人之一。

引用


  1. 诺奖得主谈「AGI试金石」:AI自创游戏并相互教学·学术头条·小瑜(2025/8/19)·检索日期2025/8/19 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. AI Release Notes podcast: Demis Hassabis on the future of AI·blog.google/technology/google-deepmind/ai-release-notes-podcast-demis-hassabis/(2025/8/19)·检索日期2025/8/19 ↩︎