TL;DR:
在具身智能的浪潮中,英伟达凭借其“机器人大脑”Jetson AGX Thor巩固了硬件和生态霸权,而字节跳动则通过自研的GR-3和Robix模型矩阵,在“模型之脑”层面异军突起。两大巨头在核心技术路径上的同频共振,预示着通用机器人时代正加速到来,并将重塑全球产业与社会格局。
“具身之脑”的进化:AI芯片与大模型驱动
当前,具身智能正以前所未有的速度席卷全球科技产业,其核心突破集中于赋予机器人“大脑”,使其能够像人类一样感知、推理并与物理世界互动。在这场竞速中,两大科技巨头——英伟达与字节跳动——不约而同地将目光聚焦于此,虽路径有别,却殊途同归。
英伟达CEO黄仁勋在GTC 2025上展示人形机器人对环境的适应性和学习能力,为“机器人大脑”的重要性定下基调。紧随其后,英伟达便推出了其划时代产品——Jetson AGX Thor(以下简称Thor)1。这款被誉为“机器人新大脑”的边缘计算平台,基于先进的Blackwell GPU架构,峰值算力高达2070 FP4 TFLOPS,AI性能较上一代提升7.5倍,能效提升3.5倍2。Thor的核心创新在于,它能在单一紧凑模块上实现过去依赖云端或多芯片处理的实时感知与决策,大幅降低了机器人的延迟和对云端网络的依赖。这意味着机器人能够更自主、更快速地应对复杂环境,为“物理AI”的实现奠定了坚实基础。
与此同时,地球另一端的字节跳动也展现出其在“机器人大脑”领域的深厚积累。在今年7月和9月,字节Seed团队先后发布了通用机器人VLA模型GR-3和Robix。GR-3(Vision-Language-Action模型)以其强大的少样本适配能力和对复杂语言指令的理解力,在真实家庭场景中展示了执行高难度任务的潜力,例如将衣架插入衬衫并挂起3。值得注意的是,据外媒披露,字节40亿参数的GR-3模型在实际应用中似乎优于英伟达20亿参数的GR00T模型3。随后发布的Robix则专注于任务规划、推理和自然语言交互,被其研究员描述为“集推理、规划和自然交互于一体的统一机器人大脑,性能优于GPT-4o和Gemini 2.5 Pro”3。GR-3和Robix协同工作,前者作为机器人的“神经元”负责执行,后者作为“大脑”负责决策,这种双系统架构与英伟达GR00T N1模型的“快慢思考”模式异曲同工,共同指向了构建具备多模态理解和复杂决策能力的通用机器人智能体。
巨头战略交织:硬件生态与模型高地
英伟达在机器人赛道的领先地位并非一蹴而就。其Jetson平台已建立起超过200万开发人员和7000余家公司的庞大生态系统。Thor的发布进一步巩固了这一地位,其硬件与软件堆栈的紧密绑定,以及CUDA工具包的广泛应用,构筑了难以逾越的生态护城河。通过Isaac机器人软件平台、AI模型库和Omniverse仿真工具,英伟达为开发者提供了端到端的解决方案,让机器人在虚拟环境中“学习”技能,再部署到现实世界,极大加速了研发周期2。这体现了英伟达“三台计算机”的战略愿景:DGX用于AI模型训练,Omniverse用于仿真测试,而Jetson Thor则作为部署后的机器人“大脑”2。然而,Thor高达3499美元的开发套件价格和较高的功率要求,使其在短期内主要面向自动驾驶、工业自动化等高端B端市场。
相比之下,字节跳动则展现出其作为内容巨头在AI领域的“隐形”实力和商业敏锐度。从2020年张一鸣对机器人的兴趣萌芽,到悄然量产1000台以上用于抖音电商和外部客户的物流机器人,字节跳动一直在低调地进行技术积累和商业落地。GR-1、GR-2到GR-3和Robix的迭代,清晰地勾勒出字节在具身智能领域从视觉-语言-动作(VLA)模型到通用机器人大脑的野心。字节的优势在于其海量的数据资源和强大的AI工程能力,这为其大模型训练提供了肥沃土壤。此外,通过关联基金锦秋基金投资宇树科技等头部企业,字节也积极参与外部产业生态,将自身模型能力与外部硬件创新相结合,形成潜在的协同效应。虽然目前字节的重心在模型侧,但其实验性机器人ByteMini的出现,也暗示了其未来可能在硬件本体上有所布局,意图打造下一代通用具身智能产品。
中国力量崛起:全球具身智能版图重塑
中国市场在全球具身智能竞赛中扮演着举足轻重的角色,这也是黄仁勋多次强调并亲自到访中国的原因。他指出,AI的下一波浪潮将是机器人,并特别提到中国在劳动力人口占比、供应链制造能力和AI技术生态方面的优势,使其将在机器人领域处于全球领先地位2。目前,包括联影医疗、万集科技、优必选、宇树科技、智元机器人等在内的多家中国企业已将Thor集成到其产品中,彰显了中国在高端机器人技术应用上的活力4。在2025年CES全球消费电子展上,黄仁勋与14家合作的人形机器人公司一同登台,其中6家来自中国,充分说明了中国企业在全球具身智能版图中的关键地位3。
字节跳动在具身智能领域的崛起,进一步强化了中国在全球AI前沿领域的创新能力。凭借其在算法、数据和算力上的投资,字节正在构建一个与西方巨头并驾齐驱的“机器人大脑”技术栈。这种中美双向驱动的创新格局,不仅加速了具身智能的技术迭代,也促进了全球产业链的多元化与竞争,最终将惠及整个产业生态。未来,中国市场巨大的应用潜力和庞大的工程师群体,将成为推动具身智能规模化落地和技术泛化的重要引擎。
未来展望:从科幻到现实的加速器
英伟达的Thor芯片和字节跳动的GR-3、Robix模型,共同构成了通用机器人从科幻走向现实的双螺旋加速器。在未来3-5年内,我们预计将看到以下几个趋势:
- 智能体能力的飞跃:得益于边缘高性能计算和日益强大的多模态大模型,机器人将不再局限于预设任务,而是能像智能体一样自主规划、学习、适应新环境,并与人类进行更自然、深度的交互。它们将能够处理非结构化环境中的复杂任务,例如家庭服务、医疗辅助、精细工业操作等。
- 物理AI的普及:Jetson Thor等芯片将把服务器级别的算力“下沉”到机器人本体,赋能从人形机器人到自动驾驶车辆、智能工厂机器臂的广泛应用。这将模糊物理世界与数字世界的界限,让AI真正“拥有身体”,影响并改变现实世界。
- 产业生态的融合与竞争:硬件平台(如Nvidia Jetson)、模型框架(如ByteDance Seed团队的成果)和仿真环境(如Nvidia Omniverse)将形成更紧密的协同。与此同时,围绕“机器人大脑”的竞争将愈发激烈,拥有全栈能力或在特定环节具备核心竞争力的企业将脱颖而出。像宇树科技这样的硬件先行者,其商业化进程将极大受益于智能“大脑”的赋能。
- 社会伦理与治理挑战:随着具身智能的普及,其对就业市场、人类生活方式、隐私保护以及潜在的伦理风险(如决策透明度、责任归属)将带来深远影响。如何平衡技术创新与社会福祉,将成为全球性的重要议题,需要政策制定者、企业和学者共同探讨应对策略。
黄仁勋和张一鸣,两位站在时代前沿的科技领袖,在“机器人大脑”这一核心命题上的战略同频,不仅仅是两家公司的方向一致,更是预示着通用人工智能与物理世界深度融合的时代大潮。尽管双方目前在“硬件大脑”和“模型大脑”上各有侧重,但随着技术的不断演进和商业化需求的驱动,未来的合作与竞争将共同定义具身智能的未来,深刻重塑人类文明的进程。