不再是“世界”的模型:Generalist AI 如何用工业效率重构机器人叙事

温故智新AIGC实验室

TL;DR:

皮特·弗洛伦斯创办的 Generalist AI 拒绝“世界模型”的过度炒作,转而通过可穿戴设备采集的 PB 级数据实现 99% 的任务成功率。这一转向标志着具身智能正式从“范式追逐”过渡到“商业交付”的严苛考验期。

在硅谷的投资圈里,如果你不给自己的初创公司冠以“世界模型”的名号,仿佛就像在一场黑领结晚宴上穿了帆布鞋一样尴尬。然而,皮特·弗洛伦斯(Pete Florence)不仅穿了,甚至还对着这顶皇冠吐了口唾沫。这位曾经在 DeepMind 参与打造 Gemini Robotics 的明星科学家,在为其具身智能公司 Generalist AI 完成 4 亿美元融资时,第一件事就是要求外界不要将公司定义为“世界模型”。

这种姿态不仅是某种意义上的学术矜持,更是对当下资本泡沫的一针清醒剂。

标签与生产力之间的鸿沟

“世界模型”的拥趸们热衷于讨论人工智能如何像人类一样去理解物理规律,这种愿景宏大且浪漫,足以让顶尖人才心潮澎湃,也足以让风险投资人签下昂贵的支票。但在皮特·弗洛伦斯眼中,这不过是某种“理念驱动型”的资本兴奋。

他在麻省理工的学术底色,与其导师拉斯·泰德雷克(Russ Tedrake)一脉相承——那是一群比起堆砌代码,更痴迷于流体动力学和物理控制的人。对他们而言,所谓的“超级智能”如果不能在生产线上精准地叠好纸箱、打包手机,那么它在本质上与一个更会说话的聊天机器人毫无区别。

Generalist AI 的核心策略在于“先设置具体目标,再设计技术路径”。通过研发可穿戴捕捉设备,他们绕过了对昂贵遥控操作数据的过度依赖,转而通过 50 万小时的真实交互数据喂养模型。GEN-1 模型实现的 99% 任务成功率,不仅仅是一个令人垂涎的性能指标,它更是一个清晰的商业信号:具身智能已经跨过了从“演示样本”到“实用部署”的临界点。

资本逻辑的重塑

如果说 2024 年是具身智能的浪漫主义时期,那么 2026 年便已进入了冷酷的现实主义时代。英伟达、贝索斯家族办公室以及华人投资者的加码跟投,折射出顶级资本对技术路线的重新筛选。

投资者们不再仅仅为“Scaling Law”这类抽象的定律买单,他们看重的是:

  • 数据采集的边际成本:相比于昂贵的专业遥控数据,Generalist AI 的低成本捕捉技术极大地优化了 ROI(投资回报率)。
  • 商业部署的鲁棒性:工业机器人多年来一直被囚禁在严控的环境中,而 GEN-1 展现出的通用能力,意味着“非结构化环境”的作业成为可能。
  • 任务掌握度(Mastery)的迭代:从 GEN-0 到 GEN-1,效率提升至原来的三倍,这种迭代速度预示着体力劳动边际成本趋向于零的愿景,正在从播客里的谈资变为工厂里的现实。

谁将成为赢家?

皮特·弗洛伦斯的“离经叛道”,本质上是对当前 AI 行业浮躁情绪的某种校准。当大多数公司还在争论谁的模型能更优雅地“理解世界”时,他已经带领团队在解决如何“改变世界”的生产流。

机器人产业的终极目标,从来不是制造一个能与人类对话的数字灵魂,而是将人类从繁重的机械劳作中解放出来。在这场军备竞赛中,那些过度沉溺于“世界模型”虚名、却无法在真实环境中稳定交付 99% 成功率的创业公司,注定会在这场残酷的商业大浪淘沙中被遗忘。

Generalist AI 是否能如其名,真正成为通用智能的代名词,尚需市场检验。但可以肯定的是,当资本不再仅仅为“人工智能”这个标签付费,而是开始为“物理世界的执行效率”买单时,机器人产业的春天,才算真正到来。

引用