黄铁军的“小宇宙”：在具身智能的混沌中，寻找AI与人类的理性共存

TL;DR：

作为智源研究院的掌舵人，黄铁军坚持“结构决定功能”的通用具身智能路径，预言机器人将在两三年内具备人类工作水平。他冷静审视AI演进中的风险与意识边界，主张在规则与监管中探寻AI与人类理性的共存之道。

在2026年智源大会的后台，黄铁军刚刚结束了一场长达70分钟、密集回应24个前沿议题的媒体交流。这位在人工智能领域深耕三十余年的学者，即便在面对关于AI“自我意识”与“失控风险”的尖锐提问时，语调依然保持着一种典型的理性克制。他坐在那里，像是一个正在观察实验室中复杂实验的导师，而非一个试图兜售AI未来的推销员。

“吾道”：一体化的世界模型

在当前具身智能领域，“百花齐放”往往意味着路线的割裂。许多企业为了快速变现，热衷于将视觉、语言、动作三个独立模型拼接成VLA（视觉-语言-动作模型）。但黄铁军对这种“拼接”持保留态度。

“企业用成熟技术解决特定场景是合理的，但智源追求的是通用具身智能。”¹ 在他看来，世界模型不是对现有模块的修补，而是一个“一体化模型”。机器人必须在自己的“脑海”中构建出一个对万事万物规律性掌握的内部模型。这不仅仅是算力的堆叠，更是对人脑运作机制的深层模拟——“人脑就是一个小宇宙，我们对这个世界都有一个模型。”¹

这种对“通用”的执着，折射出黄铁军作为科研机构管理者的纯粹：他关心的是如何让机器人学会“常识”，而非仅仅是完成一道搬运工的考题。他预判，在未来两三年内，机器人有望在日常工作中达到人类水平，但前提是必须突破对物理常识理解的边界。

数据之战：从离线到在线的范式转移

当同行们还在为高质量数据集的匮乏而焦虑时，黄铁军已经转向了“在线”。他指出，传统的离线静态数据集已无法适配当下的技术演进。“生物依靠与环境交互完成进化，而传统AI依靠离线数据建模。”¹

他提出了一个极具务实色彩的方案：通过智能穿戴设备（如耳机、眼镜）以及脑机接口，在人类正常工作与生活的过程中同步采集数据。这不仅是低成本的解决策略，更是将AI置于人类真实生存环境下的必要手段。在他的叙事中，AI不是高高在上的神祇，而是通过不断与物理世界“摩擦”来完善自身认知的学徒。

争议背后的冷静观察者

谈及AI的自我意识与潜在风险，黄铁军展现了罕见的坦诚。他并不回避“可行但不可控”的现实，但他反对通过煽动恐惧来掩盖技术本质。他认为，AI表现出类似意识的反馈，源于其深度学习了人类趋利避害的行为模式。

“人类需要食物，AI依靠电力运行，二者并不冲突，可以和谐共存。”¹ 这种理性的回应，剥离了科技狂欢背后的泡沫。对于科研成果的评价，他同样展现出一种颠覆传统的态度，直言“论文是旧时代的产物”，倡导以解决实际难题作为衡量科研价值的唯一尺度。

结语

从心脏手术中的“细胞级精度”AI应用，到对具身智能底层逻辑的深刻剖析，黄铁军始终保持着一种“一以贯之”的定力。他深知，在这个人工智能爆发的黄金时代，海淀的这片沃土为他提供了多元碰撞的可能，但他始终清醒地知道，自己的终点并非发表多少篇顶刊，而是构建一个能够真正理解这个世界的通用智能系统。

他在采访中表现出的不仅是对技术的洞察，更是一种责任感——在智能系统不断变强的过程中，人类如何保持那份不仅依赖计算，更依赖于情感与社会规则的理性地位。

引用

70分钟深度对话黄铁军：AI已有类意识行为，未来人与AI将理性共存 · 智东西 · 王涵（2026/6/13）· 检索日期2026/6/15 ↩︎ ↩︎ ↩︎ ↩︎