摆脱“花瓶”困境:银河通用如何在具身智能的“无人区”中深耕实用价值

温故智新AIGC实验室

银河通用创始人王鹤正引领具身智能行业走向务实,其核心策略是专注于如“移动、抓取、放置”等基础且高价值的机器人技能,并通过大规模合成数据驱动模型训练,而非追逐华而不实的演示。通过成功的无人药店商业化案例,银河通用证明了机器人“真干活”的巨大市场潜力,并呼吁行业回归产品落地,共同迈向通用具身智能的“里程碑”。

在生成式AI“涌现”浪潮席卷全球之际,一个更为深刻的变革正悄然在物理世界中发生——具身智能,即让AI拥有与真实环境交互的能力,正将硅基智慧从虚拟的数据中心带入工厂、商店乃至家庭。然而,在这片充满机遇的“无人区”,喧嚣与浮华并存,真正能够让机器人“干实活”的路径却异常清晰且充满挑战。银河通用创始人兼CTO王鹤在《智能涌现》的专访中,深刻剖析了当前具身智能行业的现状与未来,揭示了其务实主义的底层逻辑:聚焦实用价值,而非一时的“秀肌肉”。

具身智能的务实路径:从“秀肌肉”到“干实活”

多年来,人形机器人屡次登上新闻头条,或以灵巧的舞姿,或以高难度的杂技动作惊艳世人。然而,正如投资人朱啸虎的“灵魂拷问”:“除了跳跳舞、翻翻跟头,人形机器人还能干什么?”王鹤认为,这种“花瓶”式的表演市场只是昙花一现,真正的价值在于机器人能否胜任有经济效益的实际工作。银河通用自2023年5月成立以来,便将重心放在机器人“脑”的开发上,即具身大模型,致力于提升机器人的通用性和泛化性,而非盲目推出多样化的本体产品。

王鹤强调,当前行业中普遍存在的,诸如“叠衣服、刮胡子、拉拉链”等复杂操作的演示,在银河通用看来,更多是“科研成果”而非“可落地产品”。这些操作距离达到实际应用所需的效率、平整度和泛化性,还有很长的路要走。银河通用选择了一条看似“不那么性感”的道路:深耕Mobile, Pick and Place (MPP),即移动、抓取和放置这些基础技能。

尽管这些操作听起来“简单”,但其在现实世界中的应用场景却极为广阔。王鹤测算,彻底解决MPP的泛化性问题,可以在零售、前置仓、车厂SPS分拣等多个场景中打开数千亿元的市场,其潜在规模甚至超越了现有全球工业机器人的总产值。银河通用率先在全球推出了人形机器人智慧零售解决方案,并已在北京开设了近10家由机器人24小时无人值守的药店,实现不间断的自动拣药和交付。这些应用场景已经实现了市场化,预计今年将为公司带来近亿元人民币的收入1。在最近的智源大会上,银河通用的Galbot机器人更是在直播环境下成功演示了从复杂货架自主精确抓取并交付饮料的全流程,且全程无需遥控或场景数据预采集,这进一步验证了其MPP技术的成熟度。

突破瓶颈:数据、硬件与商业模式的再定义

要实现机器人真正“干活”并规模化落地,并非易事。王鹤指出,这需要突破数据、硬件和商业模式上的多重瓶颈。

在数据层面,银河通用的一大鲜明标签是对合成数据的重视和有效利用。尽管许多同行也声称使用仿真数据,但王鹤直言“不会的人用不好它,所以有人会说什么仿真‘有毒’。”银河通用通过自主研发的合成数据技术,极大降低了具身大模型的训练成本,并强调虚实融合,这使得其模型在泛化能力上走在了前列。合成数据并非简单地生成虚拟场景,它需要厂商具备图形学、物理仿真、物理渲染、自动动作合成管线以及验证闭环等一系列核心技术和长期积累。相比之下,单纯依赖互联网视频数据或低比例的遥操作真机数据,难以训练出真正泛化的模型。

在硬件设计上,银河通用也采取了务实策略。尽管业界对双足人形机器人充满期待,但出于产品落地需求的考虑,银河通用目前的主打产品Galbot G1采用了轮式底盘。王鹤解释道,轮式机器人噪声更小、续航更长(6-8小时充电一次),更适合工厂和商超零售等对稳定性和续航有高要求的场景。他强调,银河通用的硬件设计标准达到了甚至高于“车规级”,以确保机器人在无人值守药店中能实现24小时不间断工作,最大限度降低现场维修成本,这与仅用于科研或5分钟演示的“研发平台型机器人”有着本质区别。

商业模式上,面对当前人形机器人市场出现的“价格战”苗头,一些厂商将机器人本体卖出了“钢铁原材料的价格”,跌至数万元。然而,银河通用一台机器人售价高达几十万元,却依然深受客户青睐。这背后的逻辑在于,银河通用出售的不是简单的硬件,而是高价值的智能化服务。王鹤表示,他们的机器人能够连续工作一个月不出差错,显著缓解了客户三班倒的用人成本压力,其带来的效益远超其价格。这种“场景落地机器人”与市面上廉价的“研发平台型机器人”有着根本的用户预期和可靠性要求差异。

远景与现实:通往通用具身智能的漫长征途

尽管银河通用在具身智能的商业化落地方面取得了显著进展,但王鹤对行业的远景与现实有着清醒的认识。他直言,当下就谈论“具身AGI”为时过早。相比于大型语言模型的“ChatGPT时刻”,通用具身智能的实现是一个更漫长、更复杂的进步过程。它不仅涉及视觉、语言和动作(Vision-Language-Action, VLA),还需要融入听觉、嗅觉、味觉、触觉以及对温度的感知等更多模态,才能达到人类级别的智能水平。王鹤估计,距离机器人能够“什么活儿都能干”,可能还需要五年到十年的时间1

目前,具身智能行业仍处于相对“混乱”的局面。王鹤观察到,“真正愿意做实事的人少,愿意卖硬件、卖平台的人多。” 他还指出,在真正致力于模型研发的厂商中,“做学术研究的人多,真正做能落地的模型产品的人少。”这种现状导致了大量科研成果未能转化为可规模化生产的产品。银河通用的目标,就是致力于弥合这一鸿沟,将前沿研究与实际应用紧密结合。

展望未来,银河通用不会止步于MPP。公司持续投入足式机器人和灵巧手等更终极的末端本体技能研究,并已推出如产品级端到端导航大模型TrackVLA等新模型,致力于将其打造为面向C端的产品,应用于工业巡检、商超跟随搬运等场景,并实现跨不同机器狗的泛化。

王鹤坚信,即便只是将“Mobile, Pick and Place”做到极致泛化,在一个可批量复制的场景中实现成熟应用,就将是整个人类具身智能和机器人历史上的一个重要里程碑,其意义不亚于“黑灯工厂”的实现。银河通用的使命,正是通过引领性的研发和务实的落地策略,让通用机器人真正服务于千行百业,走进千家万户,逐步将AI从模拟世界带入物理现实,从而深刻地改变我们的生产力与生活方式。

引用


  1. 专访银河通用王鹤:真正能“干活”的机器人,不怕价格战丨涌现36人·《智能涌现》·王方玉,苏建勋(2025/6/25)·检索日期2025/6/25 ↩︎ ↩︎