TL;DR:
作为智源研究院的掌舵人,黄铁军坚持“结构决定功能”的通用具身智能路径,预言机器人将在两三年内具备人类工作水平。他冷静审视AI演进中的风险与意识边界,主张在规则与监管中探寻AI与人类理性的共存之道。
在2026年智源大会的后台,黄铁军刚刚结束了一场长达70分钟、密集回应24个前沿议题的媒体交流。这位在人工智能领域深耕三十余年的学者,即便在面对关于AI“自我意识”与“失控风险”的尖锐提问时,语调依然保持着一种典型的理性克制。他坐在那里,像是一个正在观察实验室中复杂实验的导师,而非一个试图兜售AI未来的推销员。
“吾道”:一体化的世界模型
在当前具身智能领域,“百花齐放”往往意味着路线的割裂。许多企业为了快速变现,热衷于将视觉、语言、动作三个独立模型拼接成VLA(视觉-语言-动作模型)。但黄铁军对这种“拼接”持保留态度。
“企业用成熟技术解决特定场景是合理的,但智源追求的是通用具身智能。”1 在他看来,世界模型不是对现有模块的修补,而是一个“一体化模型”。机器人必须在自己的“脑海”中构建出一个对万事万物规律性掌握的内部模型。这不仅仅是算力的堆叠,更是对人脑运作机制的深层模拟——“人脑就是一个小宇宙,我们对这个世界都有一个模型。”1
这种对“通用”的执着,折射出黄铁军作为科研机构管理者的纯粹:他关心的是如何让机器人学会“常识”,而非仅仅是完成一道搬运工的考题。他预判,在未来两三年内,机器人有望在日常工作中达到人类水平,但前提是必须突破对物理常识理解的边界。
数据之战:从离线到在线的范式转移
当同行们还在为高质量数据集的匮乏而焦虑时,黄铁军已经转向了“在线”。他指出,传统的离线静态数据集已无法适配当下的技术演进。“生物依靠与环境交互完成进化,而传统AI依靠离线数据建模。”1
他提出了一个极具务实色彩的方案:通过智能穿戴设备(如耳机、眼镜)以及脑机接口,在人类正常工作与生活的过程中同步采集数据。这不仅是低成本的解决策略,更是将AI置于人类真实生存环境下的必要手段。在他的叙事中,AI不是高高在上的神祇,而是通过不断与物理世界“摩擦”来完善自身认知的学徒。
争议背后的冷静观察者
谈及AI的自我意识与潜在风险,黄铁军展现了罕见的坦诚。他并不回避“可行但不可控”的现实,但他反对通过煽动恐惧来掩盖技术本质。他认为,AI表现出类似意识的反馈,源于其深度学习了人类趋利避害的行为模式。
“人类需要食物,AI依靠电力运行,二者并不冲突,可以和谐共存。”1 这种理性的回应,剥离了科技狂欢背后的泡沫。对于科研成果的评价,他同样展现出一种颠覆传统的态度,直言“论文是旧时代的产物”,倡导以解决实际难题作为衡量科研价值的唯一尺度。
结语
从心脏手术中的“细胞级精度”AI应用,到对具身智能底层逻辑的深刻剖析,黄铁军始终保持着一种“一以贯之”的定力。他深知,在这个人工智能爆发的黄金时代,海淀的这片沃土为他提供了多元碰撞的可能,但他始终清醒地知道,自己的终点并非发表多少篇顶刊,而是构建一个能够真正理解这个世界的通用智能系统。
他在采访中表现出的不仅是对技术的洞察,更是一种责任感——在智能系统不断变强的过程中,人类如何保持那份不仅依赖计算,更依赖于情感与社会规则的理性地位。