TL;DR:
作为谷歌Gemini模型核心研发者,Andrew Dai在亲历大厂AI从觉醒到巅峰的14年后,选择在技术狂热中保持冷静。他创立Elorian AI,致力于通过视觉推理填补大语言模型与物理世界的认知鸿沟,试图开辟一条通往AGI的“第三条道路”。
寻找“不被大公司看见”的真理
在硅谷的一个下午,Andrew Dai的办公室显得有些异样:没有通常硅谷初创公司里堆满的咖啡杯,也没有喧闹的黑客马拉松氛围。这里整洁、高效,带着一种剑桥学术式的严谨,同时也预留了充足的讨论空间——按照他的设想,未来这里将汇聚50到70位顶尖大脑。1
这是Andrew Dai离开谷歌后的第14个月。在此之前,他是那部漫长而壮阔的“谷歌AI编年史”中不可或缺的注脚:从早期的序列学习、MaskGAN,到FLAN、MoE架构,再到后来力挽狂澜的Gemini系列,他的职业轨迹几乎与深度学习的黄金时代重合。21
然而,在Gemini 3.0上线后的巅峰时刻,他选择了“出走”。对于外界而言,这或许是又一个顶级大厂人才奔赴创业浪潮的典型案例,但对于Andrew来说,这更像是一次对技术理想的回归。“大公司有大公司的生存法则,但在那个规模之下,哪怕是几十亿美金的投入,也会让创新被迫走向平庸。”他说。1
错失与觉醒的编年史
回顾14年的谷歌岁月,Andrew Dai的讲述中透着一种温和的客观。他并不回避曾经的错失:谷歌内部官僚体系的厚重,往往让原本领先的预训练范式被OpenAI抢占了先机。“GPT-3发布时,谷歌确实感到了压力。”他回忆道,那场压力后来演变成了DeepMind与Google Brain的强制整合,“两个团队同心协力,但整合过程中的摩擦与博弈,让Gemini 1.0的研发被迫在创新与进度之间做了妥协。”1
他曾与Transformer的作者讨论过将预训练与Transformer结合的构想,却因当时公司转向医疗AI的方向而遗憾错过。这一经历成了他职业生涯的重要教训:研究品味不仅关乎技术深度,更关乎对时机的敏锐把握。 1
在Andrew看来,大厂最稀缺的资源不是算力,而是不受干扰的研发时间。当几千人围绕一个模型转动时,哪怕是极其微小的激进改进,也会被繁琐的评估流程稀释殆尽。离开,成了他保持研究敏锐度的唯一途径。1
视觉推理:AGI的最后拼图
Andrew创立的Elorian AI,目标明确地指向了当前大模型生态的“盲区”——视觉推理。34
“目前的模型可以生成视频、图片,甚至写出华丽的代码,但它们并不理解自己所处理的对象。”他用老鹰捕食的比喻来拆解这种理解能力:老鹰不需要懂万有引力定律,却能精准计算气流与速度以截获猎物;而现有的AI模型,虽然拥有海量数据,但在基础的视觉常识、空间逻辑与物理规律推理上,依然表现得像个“盲人”。1
他认为,纯粹的大语言模型(LLM)路径已经陷入了Scaling(扩展)的瓶颈,而学术界的纯视觉模型(World Models)又往往陷入“为论文而论文”的窠臼。“我们的逻辑是,构建一个原生的多模态全栈模型,将语言推理与视觉推理深度结合。” 51
研究者的“苦行”
这位曾经的谷歌核心科学家,如今正在经历一种截然不同的创业苦行。过去在谷歌,代码库与资源触手可得;现在,他需要亲手处理IT架构、面试候选人、甚至亲自参与CUDA算子的优化。但他乐在其中,“在初创公司,我们买的卡不会被拿走,方向不会每周一变,这就是所谓的研究自由。” 1
他依然保持着那个14年前的习惯:在最安静的时刻思考技术路径。对他而言,最好的想法往往不在会议室里诞生,而在洗澡、散步或者午后的短暂沉思中。1
当被问及如果重来一次,是否会改变什么时,他只是微微一笑:“技术发展的窗户期很短,能成为这段历史的参与者和见证者,我已经足够幸运。”而对于未来的视觉AGI,他展现出了极度的审慎与自信——那不是一场关于算力的竞赛,而是一场关于谁能更深刻地理解物理世界的耐心博弈。1
引用
-
谷歌AI的14年、Gemini翻身之战,与视觉理解模型:专访DeepMind前核心科学家Andrew Dai·硅谷101·(2026/5/20)·检索日期2026/5/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Top Chinese Scientists from Google Gemini and Apple Quit Jobs to Launch Own Ventures Aiming at AGI·36Kr·(2026/5/20)·检索日期2026/5/20 ↩︎
-
前谷歌DeepMind和蘋果公司的研究人員為一家名為「Elorian」的多...·Reddit·(2026/5/20)·检索日期2026/5/20 ↩︎
-
ElorianAI获5500万美元融资,以“视觉推理”探索物理世界AGI·36Kr·(2026/5/20)·检索日期2026/5/20 ↩︎
-
谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI·知乎专栏·(2026/5/20)·检索日期2026/5/20 ↩︎