TL;DR:
Demis Hassabis勾勒了AGI在5-10年内实现的前景,预言其将开启“科学的黄金时代”,并强调DeepMind正通过Genie世界模型、AI驱动药物研发及机器人技术,构建理解物理世界、具备创造力、且能持续学习的通用智能。这些突破将重塑产业生态,同时需解决一致性、创造力与大规模硬件部署的挑战。
近期,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)在一次深入访谈中,分享了他对通用人工智能(AGI)未来十年发展的深刻洞察,从技术前沿的突破,到其对科学、社会乃至人类文明进程的深远影响。他不仅仅是一位诺贝尔奖得主,更是一位站在AI哲学与工程前沿的思考者,其言论为我们描绘了一幅激动人心的未来图景,也揭示了通往AGI之路的诸多挑战与机遇。
通往AGI的“黄金时代”:DeepMind的蓝图与挑战
哈萨比斯再次强调了其在十年前作出的预言——AGI有望在2030年左右实现,并坚信“如果我们在未来十年内拥有完全的AGI,将开创一个科学的黄金时代,一种新的文艺复兴。”1 这项宏大愿景的核心在于,真正的AGI必须能够理解我们周围的物理世界,而不仅仅是语言或数学的抽象领域。当前AI系统虽然在特定领域表现出色,但仍面临瓶颈:缺乏跨领域的一致性(“博士级智能”的误区),不能提出新的猜想或假设的“真正的创造力”,以及持续学习能力的缺失1。
这一愿景的实现,将使AGI成为加速科学发现的终极工具。DeepMind已在蛋白质结构预测(AlphaFold)、材料设计、核聚变控制、天气预报及数学奥林匹克竞赛解题等多个科学领域取得显著进展1。然而,哈萨比斯也坦承,目前AI系统仍未具备人类顶尖科学家那种“直觉飞跃”式的原始创造力,即从其他领域发现可类比模式并迁移解决问题的能力。这种创造性跃迁,例如在1901年知识截止点后能像爱因斯坦在1905年那样提出狭义相对论,将是衡量AGI是否成熟的关键测试之一。
世界模型:理解物理世界的关键之匙
DeepMind在构建AGI的道路上,正通过“世界模型”这一核心概念迈出关键一步。其最新发布的Genie 3模型,不仅能根据文字描述即时生成可交互的沉浸式虚拟世界,更颠覆性地通过分析数百万段真实世界视频和游戏引擎合成数据,自主推导出光线反射、物体运动等物理规律,而无需人工预编程12。这意味着Genie 3正在通过逆向工程学习物理世界,生成的所有像素都是即时且动态的,当玩家探索到某个区域时,该区域的内容才被实时生成。
Genie 3的突破性意义在于,它代表了AI系统深度理解世界规律的证明。哈萨比斯指出,这不仅是通往AGI核心命题——理解物理世界的关键,也为机器人技术和未来AI助手(如智能眼镜)的实用化奠定了基础1。它能够为其他AI智能体(如Sima游戏代理)提供无限的训练数据,形成“一个AI在生成世界,另一个AI在这个世界里运行”的独特模式2,极大加速通用人工智能系统的训练进程。从哲学思辨的角度,哈萨比斯甚至提出,Genie 3等技术或许能为我们揭示“现实的本质”提供新的视角2。
具身智能与机器人技术的范式变革
世界模型的发展,无疑将加速机器人技术的革命性突破。DeepMind的Gemini机器人模型已能将语言指令转化为精准的物理动作,这展示了多模态模型将现实世界理解能力融入交互过程的强大潜力1。哈萨比斯透露,DeepMind正积极推行“安卓模式”战略,旨在打造跨机器人的通用操作系统层,同时也在探索垂直整合,将最新模型与特定机器人类型深度结合,实现端到端的学习优化1。
对于机器人形态的争议,哈萨比斯持务实态度,认为人形机器人和专用机器人将“都会有一席之地”1。鉴于人类所处的物理世界是为人类设计的,人形形态对日常任务而言极具价值;而工业领域的特定任务则仍需专用机器人形态进行优化。当前机器人技术仍处于早期阶段,哈萨比斯将其类比为“70年代的PC初期阶段”1,原型机涌现但标准未统一,然而AI时代的变化速度将呈指数级加速。未来几年内,算法的升级以及硬件规模化部署时机的选择,将是实现数百万机器人服务社会、提高生产力的关键。
AI for Science:加速人类前沿突破
哈萨比斯将用AI加速科学发现和改善人类健康视为其毕生致力于AI研究的核心动力。继AlphaFold在蛋白质结构预测方面取得里程碑式突破后,DeepMind的衍生公司Isomorphic Labs正致力于彻底变革药物研发。通过构建多个“相邻的AlphaFold”系统,例如设计能精准结合靶点且无副作用的化合物,Isomorphic Labs有望在未来十年内将药物研发周期从数年甚至十年缩短到几周甚至几天1。目前,Isomorphic Labs已与礼来(Eli Lilly)和诺华(Novartis)等制药巨头建立了重要合作,并推进内部药物研发项目,预计明年将进入临床前阶段1。这种AI驱动的科学发现模式,预示着一个由智能系统加速人类认知边界突破的新纪元。
创意工具的民主化与专业化双轨效应
在创意领域,Nano Banana等图像生成器展示了AI对产业生态的深远影响。其“惊人的一致性”允许用户在迭代创作中保持核心元素不变,极大地降低了创意门槛1。正如哈萨比斯所言,未来创意工具将“让每个人都能使用和创作,而不必像我们过去那样学习极其复杂的用户体验和用户界面。”1 这意味着普通用户(如YouTuber)将更容易创作高质量内容。
然而,这并非简单的普及化,而是一种“双轨赋能效应”。DeepMind正与达伦·阿伦诺夫斯基等顶级电影制作人合作,通过Veo等工具重塑下一代创作流程。专业创作者能够实现十倍乃至百倍的效率提升,以极低成本尝试各种创意构想,最终精准实现理想效果1。哈萨比斯也强调,“并非所有人都能获得相同输出质量,因为其中还涉及使用技巧、审美视野和叙事能力等专业素养”1。这种模式下,优秀的创作者将能以前所未有的速度迭代,而未来娱乐业也可能出现融合共创的新艺术形式,由“世界编辑”主导框架,百万人参与共创。
混合智能与能源悖论的深层思考
在技术架构层面,哈萨比斯指出,AGI的实现可能需要“混合模型”——将概率性(基于数据学习)与确定性(融入已知物理化学规则)组件相结合1。AlphaFold便是这种混合模型的典范。生物学和化学领域数据稀疏的特点,决定了纯粹的数据驱动模型难以奏效,因此将原子键角等化学原理作为约束条件融入模型,能显著提升效率。混合系统的终极目标是“将已验证的解决方案上游化整合到学习组件中”1,最终实现端到端学习,如AlphaZero通过自我对弈学习一切游戏规则,而非依赖人类棋谱。
关于AI日益增长的能源需求,哈萨比斯认为这既是挑战也是机遇。他承认前沿模型为实验新想法仍需持续扩大规模,导致能源消耗巨大。然而,谷歌和DeepMind已在服务端效率方面取得显著进展,通过蒸馏等技术使相同性能下的模型能效在两年内提升了10倍甚至100倍1。更重要的是,他坚信在未来十年内,AI系统在能源效率、材料设计、新型能源等领域的回馈,将远远超过其自身的消耗1。这种乐观预判基于AI作为强大工具,能够反哺并解决自身所带来的部分挑战。
在哈萨比斯看来,我们正站在一个技术奇点的前夜。AGI的到来不仅仅是计算能力的飞跃,更是人类文明进程中一次深刻的结构性变革。它将重塑我们认知世界、改造世界,乃至创作和娱乐的方式,开启一个前所未有的智能纪元。