李飞飞对AGI泼冷水: Scaling Law 困境下的空间智能范式转移与具身AI未来

温故智新AIGC实验室

TL;DR:

李飞飞教授对当前AI过度依赖Scaling Law和“通用人工智能”(AGI)概念提出批判,指出其作为营销术语的局限性。她强调,AI的未来突破在于空间智能世界模型,这将是实现真正具身智能、机器人技术进步,并最终增强人类理解与互动物理世界的关键。

斯坦福大学教授、World Labs 联合创始人兼 CEO 李飞飞近日在海外播客上发表了极具洞察力的观点,为当前AI领域狂热的AGI和Scaling Law(规模定律)思潮泼了一盆冷水 1。她直言不讳地指出,AGI更多是“营销话术”,而非严谨的科学定义,而AI的未来发展不能仅仅依赖无止境的数据和算力堆砌,更需要根本性的技术创新。这一论断不仅是对现有范式的深刻反思,更指明了下一代AI突破的清晰路径:从单一的语言智能走向对物理世界更深层次的空间智能世界模型

突破 Scaling Law 瓶颈:从语言智能到空间智能的范式转移

回顾现代AI的“黄金配方”——神经网络、大数据与GPU的结合——从ImageNet项目到ChatGPT的成功,无不印证了这一配方的强大威力。李飞飞将其定义为“苦涩的教训”,即“简单模型配合海量数据往往比复杂模型加少量数据更有效”。然而,她同时警示,这种“堆砌”式的Scaling Law发展模式已接近其效能边界。当前的AI模型,尽管在语言理解和生成方面表现惊人,却依然难以完成许多对人类而言轻而易举的任务,例如在视频中精确数数,或像牛顿那样从观察中推导物理定律 1

这种能力上的鸿沟凸显了现有AI系统的根本性局限:它们在处理抽象知识和语言符号方面表现出色,却如同在“黑暗中行走”,缺乏对物理世界的真实理解和交互能力 2。换言之,以大型语言模型(LLMs)为代表的“语言智能”虽然已极大地拓展了AI的能力边界,但其本质上仍停留在2D的符号层面,难以真正掌握三维乃至四维世界的动态规律和空间关系。

李飞飞的观点直指核心:真正意义上的智能,尤其是那些能够与现实世界互动、进行复杂推理和创造的智能,绝不能止步于语言。人类智能的根基之一便是其强大的空间智能——我们理解、导航和与物理环境交互的能力。这不仅仅是对物体识别或路径规划的静态理解,更包含了对空间、时间、因果关系的动态推理。因此,AI的下一个前沿,必须是向空间智能的深刻范式转移,这要求AI从“阅读”世界转向“感受”和“操纵”世界。

世界模型与具身智能:构建AI理解物理世界的“心智”

要实现这种范式转移,李飞飞提出世界模型将成为推动下一阶段AI发展的关键方向 3。与传统的语言模型仅限于文本或图像生成不同,世界模型旨在构建一个能模拟物理世界的内部表征。这意味着AI不仅能根据指令生成一个虚拟世界,还能让智能体在其中进行互动、推理,甚至预测物理定律。

这对于具身智能机器人技术的发展具有颠覆性意义。机器人要真正在三维空间中操控物体、理解复杂环境,必须具备强大的世界模型作为其规划路径、理解场景、执行操作的基础。李飞飞用自动驾驶作为例子,即便经过二十年发展,仍未完全成熟,而机器人在三维空间中与物理世界互动、操控物体,其难度远超自动驾驶的二维平面任务 1。传统的“苦涩的教训”在机器人领域并不完全适用,原因在于机器人数据难以获取且无法像语言数据那样自然“对齐”,同时机器人是物理系统,而非纯软件模型,其复杂性呈几何级增长。

她的公司World Labs推出的Marble产品,正是对这一愿景的实践。Marble并非简单的视频生成模型,其核心在于生成可探索的三维世界,强调对三维和四维世界的理解、互动和推理 1。这使得创作者、游戏开发者、设计师和研究者能够快速生成沉浸式场景,并应用于电影虚拟制作、心理学实验和机器人训练环境模拟等领域,展现出巨大的商业潜力和应用价值。Marble的出现,预示着一个由AI构建的,允许智能体在其中学习、试验、进化的“数字孪生宇宙”正在加速形成。

重塑人机关系:AI作为人类“具身”能力的增强器

李飞飞的洞察超越了纯粹的技术讨论,触及了AI与人类文明的深层关系。她驳斥了“AI取代人类”的普遍焦虑,强调任何技术发展都不应以牺牲人的尊严与能动性为代价。在她看来,AI的真正价值在于成为增强人类能力、服务于人类需求的赋能者 1

从语言层面,AI已在写作、软件工程等领域增强了人类能力;未来,世界模型和空间智能有望在具身层面增强人类。这意味着我们可以在空间理解、物体操作和现实世界任务中获得新的力量。例如,DNA双螺旋结构的发现依赖于人类从2D图像进行3D空间推理 1——这种跨维度的空间抽象正是当前AI难以企及的。如果世界模型能突破这一瓶颈,将使AI具备更深层次的空间推理能力,进而赋能人类在科学发现、设计和工程等领域的创造性突破

这是一种更具哲学思辨色彩的未来主义视角:AI并非独立于人类的竞争者,而是人类智能的延伸和增强,尤其是在我们感知、理解和重塑物理世界的能力上。

未来展望与伦理考量:迈向更深刻的智能理解

李飞飞的“冷水论”及其对空间智能的强调,预示着AI领域将迎来一场深刻的范式变革。未来3-5年,我们预计将看到以下趋势:

  • 模型架构的根本性创新:超越Transformer架构,探索更能有效处理时空信息和因果关系的全新模型。
  • 多模态融合的深化:语言、视觉、听觉、触觉等感知数据将更紧密地融合,共同构建世界模型。
  • 具身AI的加速发展:机器人不再是单一任务的执行者,而是能自主学习、适应复杂环境的智能体,这将引发机器人硬件、软件和应用场景的全面升级,有望成为继LLM之后下一个万亿美元市场。
  • “AI for Science”的新突破:具备空间推理能力的世界模型将加速物理、化学、生物等基础科学的发现进程。
  • 对数据范式的重新定义:高质量的具身数据和模拟环境数据将变得极其珍贵,合成数据技术也将愈发重要。

从商业角度看,投资将从单纯的“大模型竞赛”转向对具身智能、世界模型和空间智能相关技术和应用领域的倾斜。World Labs等初创公司若能在此领域取得关键突破,将拥有巨大的市场潜力和战略价值。然而,伴随技术演进,对AI伦理的考量也必须同步进行。确保技术发展以人为本,保障人的尊严和能动性,将是AI时代的核心治理准则。

最终,李飞飞的观点提醒我们,真正的智能并非一蹴而就的“通用”能力,而是需要通过对物理世界的深刻理解、多模态信息的融合、以及与人类智能的协同演进,才能逐步构建的复杂系统。在AI时代里,每个人都有属于自己的一席之地 1,而我们正在共同探索的,是智能的更深层含义。

引用


  1. 智东西: 李飞飞给AGI泼了盆冷水·智东西·陈骏达 (2025/11/17)·检索日期2025/11/18 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 澎湃新闻: 李飞飞发表长文:空间智能是AI下一个前沿·澎湃新闻 (日期不详)·检索日期2025/11/18 ↩︎

  3. 网易: AI教母李飞飞最新论人工智能: 为什么世界模型是下一个热点·网易 (日期不详)·检索日期2025/11/18 ↩︎