王兴兴的具身智能罗生门：争议背后的技术哲学与产业前瞻

TL;DR：

宇树科技创始人王兴兴以其“反共识”言论，精准揭示了具身智能领域AI模型匮乏、硬件先行但智能滞后的核心矛盾。他的批判性洞察不仅挑战了主流技术路线，更以开源精神和对市场趋势的独到预判，重塑着人形机器人的技术范式、商业想象和社会角色，为产业的未来发展指明了方向。

在人工智能浪潮席卷全球的当下，具身智能作为连接AI与物理世界的前沿阵地，正吸引着前所未有的关注。在这场技术与资本竞速的赛道上，宇树科技（Unitree Robotics）创始人王兴兴以其独树一帜的“非共识”言论，在喧嚣中划出一道清醒的界线。他看似“语不惊人死不休”的表态，实则蕴含了对具身智能现状的深刻技术洞察、对产业未来趋势的精准预判，以及对技术与社会关系深层意义的哲学思考。

“硬件够用，AI完全不够用”：技术瓶颈的深度剖析

王兴兴的核心观点直指具身智能发展的最大症结：AI模型而非硬件，是人形机器人规模化应用的“最大卡点”¹。他认为，即便是一两年前的硬件也“够用”，但当前人形机器人的AI水平，约相当于ChatGPT问世前的1到3年。这一判断并非空穴来风，它揭示了AI与机器人硬件发展之间的结构性失衡。

具体而言，王兴兴对当前业内普遍采用的VLA（Vision-Language-Action，视觉-语言-动作）模型架构持“怀疑态度”，甚至称之为“傻瓜式架构”²。他指出，VLA模型在真实世界交互中的数据质量和数量均不足，即便结合强化学习（RL）训练，也“不够用”，模型架构亟待升级优化³。这与国家地方共建人形机器人创新中心首席科学家江磊的观点形成呼应，后者也承认“感知-认知-决策-执行的闭环尚未闭合”，并呼吁重构VLA模型²。

王兴兴的批判并非简单的否定，而是基于其团队实践的建设性思考。宇树科技在尝试VLA+RL后，选择开源了UnifoLM-WMA-0世界模型-动作架构。这体现了一种“去中心化”的技术理想，即在AI模型商业价值尚未完全显现、落地仍有距离时，通过开源来“众人拾柴火焰高”，加速整个领域的进步。这与OpenAI早期的策略有异曲同工之妙，旨在构建一个更具协作性的AI生态。

此外，王兴兴还强调了“Scaling Law”（尺度定律）在机器人模仿学习中的重要性¹。他认为，目前机器人训练新动作仍需从零开始，效率低下。解决Scaling Law问题，实现新训练基于已有成果的快速迭代，是提升机器人泛化能力和学习效率的关键。这不仅是技术层面的挑战，更触及了AI智能体从“特定任务执行者”向“通用学习者”演进的哲学核心。

从争议到印证：市场与社会预判的含金量

王兴兴的言论虽然常常“打破共识”，却屡屡被市场动态所印证，这反映了他对产业规律的深刻洞察和对赛道本质的清醒认知。

首先，在市场估值方面，当宇树科技进入IPO进程，业内出现“行业有泡沫”的声音时，王兴兴笃定地回应“从未来看现在是没有泡沫的。”⁴ 这一判断对照Figure估值飙升至390亿美元，而国内头部厂商仍停留在百亿级估值，显得格外具有前瞻性。他预判未来几年全球人形机器人行业每年“翻一番”⁴，并指出上半年行业平均增长50%-100%，也得到了下半年密集出现的大额订单潮的验证，如龙旗科技、深圳慧智物联等采购智元机器人，以及Figure和特斯拉的量产计划⁴。

其次，在需求侧的争议上，王兴兴对科研需求和展演场景价值的看法，也逐渐被行业所接纳。面对“宇树订单多由高校买单”的质疑，他明确指出科研需求是产业“基石”，高校的技术探索与人才培养为赛道储备了核心动能⁴。这不仅是事实，更是对技术生态构建的深刻理解。

更具洞察力的是他对展演场景的价值判断。在宇树机器人因春晚展演“出圈”却被质疑“天花板低、无实际价值”时，王兴兴表示“只要大家喜欢，提供情绪价值也是它的价值，这也是在创造新的需求。”⁴ 他的观点认为，机器人表演和比赛是未来机器人产业的重要组成部分，是当下“循序渐进”满足大众诉求的方式。此后，Optimus人形机器人出席电影首映礼、表演功夫等动作，以及迪士尼、首形科技等布局文娱市场的趋势，都意外呼应了他的预判。这不仅仅是商业策略，更是一种对技术与文化融合的哲学思考——机器人不仅是工具，更能成为人类情感的载体和文化符号的一部分。

挑战与前行：具身智能的未来图景与宇树的航向

尽管王兴兴的许多预判被印证，但也有少数观点与行业节奏出现偏差，例如他曾表示“机器人进入家庭场景还比较远”。然而，Figure 03被明确设计为家庭用途，挪威1X的NEO、国内傅利叶GR-3等也正加速推进家庭场景，注重安全、亲近的设计，并积极获取真实家庭数据⁴。这反映了技术迭代的加速，以及不同企业对市场切入点和路径的差异化理解。

宇树科技在争议中前行，王兴兴本人也从一个“小镇做题家”带领公司迈向上市前夜，估值已达百亿。他的经历本身就代表了AI时代的一种公平性：只要“聪明、想做事、想达成自己的目标，大家都有机会让荒漠上长出参天大树。”⁴

从技术层面看，具身智能的未来将是一个软硬件深度协同、AI模型不断进化的过程。王兴兴对世界模型、Scaling Law等前沿方向的关注，预示着行业将从当前以VLA为主的“感知-执行”模式，向更具通用性、自主学习能力的“大脑”架构演进。这种演进不仅需要技术团队的突破，更需要整个产业生态的开放协作，共同攻克数据、算力、模型架构等核心挑战。

从商业角度审视，具身智能的商业化路径将呈现多元化趋势。科研与工业应用是基石，而娱乐、教育等提供“情绪价值”的场景，则为市场拓展提供了广阔空间。随着机器人成本的下降和智能水平的提升，家庭场景的普及将成为下一个蓝海。宇树科技通过矩阵策略与友商All In One策略的对比，也反映了不同企业对市场和技术路径的抉择。

从社会影响来看，具身智能的普及将深刻改变人类的生产与生活。机器人从简单的工具进化为具备一定自主决策能力和情感互动潜力的智能体，将引发关于人类工作、伦理规范乃至存在意义的深层讨论。王兴兴对“AI荒漠”的比喻，既是对现状的冷静判断，也是对未来无限可能性的展望——当具身智能真正实现其“GPT时刻”，它将不再是遥控的“大玩具”，而是成为人类文明进程中不可或缺的伙伴。

宇树科技和王兴兴的实践与争议，正是具身智能产业高速发展的一个缩影。它不仅关乎技术的迭代和商业的成功，更关乎我们如何理解智能的本质，以及如何构建一个人类与智能体共存共荣的未来。

引用

王兴兴：人形机器人规模应用的最大卡点是AI模型不够用·新闻·科学网（2025/8/9）·检索日期2024/05/29 ↩︎ ↩︎
质疑VLA模型、AI完全不够用？有从业者隔空回应宇树王兴兴·第一财经·刘佳（2025/8/11）·检索日期2024/05/29 ↩︎ ↩︎
宇树科技王兴兴：对VLA模型持怀疑态度·新浪财经（2025/8/9）·检索日期2024/05/29 ↩︎
王兴兴，话里有话·具身研习社·彭堃方（2024/05/29）·检索日期2024/05/29 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎