TL;DR:
谷歌在今年的I/O大会上火力全开,直接抛出了“世界模型”的概念——让AI像人类大脑一样模拟现实、制定计划。Gemini 2.5 Pro不仅要当你的随身翻译官,还要变成能同时干十件事的超级打工人,连眼镜都安排上了。隔壁的Siri和Copilot,你们慌不慌?
谷歌的“世界模型”到底是个啥?
你可能还在纠结AI到底是“生成文字的工具”还是“替你查资料的小助手”,但谷歌已经跳过了这些“新手村”问题,直接瞄准了一个听起来就很科幻的目标:让AI成为“世界模型”(World Model)。
翻译成人话就是:让AI不仅能“理解”你说的话,还能模拟真实世界的各种场景,然后帮你规划出一个靠谱的计划。比如,你问它“明天去迪士尼玩,怎么安排最省时间?”它不光能告诉你路线,还能在脑子里模拟一遍明天的天气、人流、交通,甚至你孩子会不会在某个项目前哭闹——然后给你一个定制方案。
这听起来是不是有点像《三体》里的“智子”?别急,谷歌在最新的官方博客里1说了,他们从AlphaGo玩围棋、学《星海争霸》开始,就已经在训练AI这种“在虚拟世界里规划”的能力。现在,他们把这一套用到了Gemini 2.5 Pro上——这是目前谷歌最猛的多模态模型,能看懂文字、图片、视频、音频、代码,甚至能用一张图片直接生成一个你可以进去玩的3D模拟环境(没错,就是Genie 2那玩意儿)。
Project Astra:你的AI眼镜,不只是个翻译机
还记得去年谷歌I/O上那个“概念视频”吗?一个妹子戴着智能眼镜,边走边问“这个音箱的开关在哪?”,眼镜直接告诉她答案。当时大家都觉得——嗯,未来可期,但还得等几年吧?
结果今年谷歌直接甩出了 Project Astra 的落地版。简单说,就是把这套实时语音、视频理解、记忆能力塞进了Gemini Live,然后通过眼镜这种新形态设备来释放。
现场演示环节,主持人戴着原型眼镜走进一个房间,眼镜立刻识别出周围的物体,还能实时翻译墙上的外文海报。最骚的操作是:主持人问“我刚才把车钥匙放哪了?”眼镜沉默两秒,回了一句:“你进门的时候把它放在了茶几上的杂志下面。”——记忆能力+环境理解,这已经不是单纯的“语音助手”了,这就是一个长在你眼睛上的“第二大脑”2。
虽然谷歌官方只说向“trusted testers”开放测试,但按这个节奏,明年搞不好就能买到399美元的谷歌眼镜2.0——你敢信?
Project Mariner:一个AI替你干十件事,这算不算“内卷”?
如果说Astra是让你“看得更清楚”,那Project Mariner就是让你“不用干活”。
这个项目去年底开始测试,当时只能在浏览器里帮你完成一些简单的操作(比如填表格、查机票)。但今年I/O上,谷歌升级了一波:Mariner现在可以同时完成最多十种不同的任务。
想象一下这个场景:
- 你在开会,Mariner正在后台帮你查三家航空公司的机票价格
- 同时还在帮你预约明天下午的牙医
- 顺便把上次聚会的照片整理成相册
- 然后它还在偷偷刷小红书,给你推荐今晚的餐厅
这不是科幻电影,这是谷歌在发布会上的实时演示。而且他们特别强调了“多任务并行”——这些代理不是一个个排队干的,而是同时开工,像你电脑里开了十个浏览器窗口一样1。
不过别担心它乱买东西,Mariner在操作你账户之前会先弹窗问“哥,这段我花了123美元,你准不准?”——安全机制还是有的,毕竟谷歌知道用户最怕的就是AI偷偷下单。
谷歌的“三线作战”:眼镜、浏览器、全能模型
看完这一圈,你会发现谷歌今年的策略其实很清晰:三个产品线,覆盖你生活里所有需要“脑子”的地方。
- Gemini 2.5 Pro:负责做最底层的大脑,理解世界、模拟世界、制定计划
- Project Astra + 眼镜:负责当你的“随身感知器”,走到哪帮你看到哪
- Project Mariner + 浏览器:负责当你的“数字打工人”,帮你搞定所有线上杂事
这仨组合起来,就是谷歌嘴里那个 “通用AI助理”(Universal AI Assistant)——它不再是一个你主动去问的聊天框,而是一个随时在你身边、看懂你的场景、主动帮你干活的隐形助手。
当然,挑战也很明显:隐私怎么办? 眼镜一直拍,Mariner一直帮你操作账户,这数据安全和授权管理要是没搞好,分分钟变成个人肉监控器。谷歌自己也说了,他们做了“至今最大规模的伦理前瞻计划”,但具体效果……得等真正大规模上市才知道。
所以,其他AI助手慌不慌?
老实说,OpenAI的ChatGPT和微软的Copilot目前还在“对话框里打转”,最多加上个语音模式。而谷歌直接把整个生态都串起来了——搜索、Gmail、地图、YouTube、Google Cloud……再加上硬件(眼镜、手机、甚至未来的机器人),这种软硬一体的协同,短期内真没对手能复制。
当然,苹果的Siri和Meta的眼镜也都在发力,但这次谷歌的步子明显更大。用一句网络流行语总结就是:
“你们都是来争第二的吗?”(开玩笑的,但确实有内味儿了)
引用
-
我们打造通用 AI 助理的愿景·Google Blog·(2026/6/9)·检索日期 2026/6/9 ↩︎ ↩︎
-
谷歌I/O大会All in AI:Gemini模型上新,搜索框25年来最大改版·awtmt·(2026/6/9)·检索日期 2026/6/9 ↩︎