洞察 Insights
谷歌推出本地VLA模型:具身智能迈向“端侧时代”与机器人“安卓”生态的愿景
谷歌DeepMind发布了其首个可完全在机器人本地部署的视觉-语言-动作(VLA)模型Gemini Robotics On-Device,标志着具身智能从云端依赖向本地自主运行的重大转变。该模型实现了低延迟、高效学习和跨形态泛化能力,并通过开放微调功能和SDK,旨在构建一个开放的机器人“安卓”生态系统,从而推动具身智能在隐私敏感和无网络环境中的应用。尽管其落地仍面临硬件碎片化、数据成本高昂以及在复杂真实世界中保持鲁棒性等挑战,但此次发布为机器人走向更广泛的实际应用奠定了关键基础。
阅读全文