5人通宵40天、被华尔街日报“拉踩”,DeepMind主管爆Gemini内幕:AI抢不走你的饭碗,但得有点“脏活”觉悟

温故智新AIGC实验室

TL;DR:

谷歌DeepMind的Gemini预训练主管Vlad Feinberg最近聊了聊AI圈内那些“不体面”的真实故事:5个人死磕40天不睡觉才把模型训出来;华尔街日报为了制造“DeepSeek碾压谷歌”的爆款新闻,故意在排名表里删掉了第一名的Gemini。他还给焦虑的程序员们指了条明路:别怕AI抢饭碗,但得肯干那些“脏活累活”。


如果让你想象一下谷歌DeepMind研究员的工作日常,你的脑海里是不是浮现出这样的画面:在黑板上推导颠覆性算法,随手就能发一篇顶会论文,然后优雅地喝一杯手冲咖啡?

醒醒,那是电影。真实的画风可能是:5个满脸写着“困”字的工程师,在硅谷和巴黎之间24小时倒班,连续40天几乎不眠不休,只为了一件事——不让几百万美元的算力打水漂。

最近,Google DeepMind的Gemini预训练主管Vlad Feinberg在一档播客里,狠狠地撕开了AI前沿实验室那层“赛博朋克”的滤镜。他聊的全是那些不性感但异常真实的东西:显存溢出、编译器调参、以及为了把模型塞进老旧TPU卡里而做的“重体力活”。1

这恐怕是AI圈最“去魅”的一次访谈了。

1. 5人死磕40天,和那个被“和谐”的Gemini排名

现在大家聊AI,动辄就是“万亿参数”、“AGI奇点”。但Vlad透露,Gemini 2.0这个被外界吹上天的MoE(混合专家模型),背后其实只有5个人在硬扛。

“算力卡随时会挂,数据索引随时会断,”他回忆道,“为了不浪费钱,我们只能双城倒班,那40天基本没怎么睡。”

听起来是不是有点像创业公司的“血汗工厂”?但这就是前沿。

更扎心的是后续。Gemini 2.0出来后,正好赶上DeepSeek-V3爆红。《华尔街日报》为了写一篇“中国开源模型吊打美国大厂”的爆款文章,直接弄了个排名对比表格。Vlad的朋友给他发来截图,图上DeepSeek紧咬ChatGPT,而Gemini被甩到了最底下。

Vlad一看,乐了。“我一直在看那个排行榜,因为我们刚发布了一个新模型,排名根本不是这样。”他仔细一研究才发现,《华尔街日报》在表格里“巧妙”地省略掉了(elided)当时排名高居第一的Gemini 2.0 Flash Thinking。1

所以,当你在网上看到所谓“技术对决”的神话时,背后可能没有惊心动魄的算法大战,只有媒体为了流量搞的“拉踩”,以及几个工程师的黑眼圈。

2. Jeff Dean亲发奖金,竟是因为“干脏活”

Vlad还讲了一个故事,直接暴露了AI工程师的“职业鄙视链”真相。

他职业生涯最重要的一笔奖金,来自谷歌传奇人物Jeff Dean。那是在第一代Bard项目最焦头烂额的时候。当时Vlad刚入职Google Brain,没有像其他Transformer作者们去写高大上的论文,而是默默干了几天最不体面的活:调编译器、调超参、解决显存溢出,硬是把一个叫SFT(监督微调)的任务塞进了一堆老旧TPU卡里,才勉强让Bard跑起来。 1

这段经历让他彻底悟了:“写再牛逼的学术论文,都不如帮团队省下几张卡的显存。

Vlad认为,在当前的AI研发一线,最容易拿奖金的能力,恰恰是那些看起来“很low”的工程能力。很多人沉迷于玩框架、看论文,却搞不定真正的生产环境。而那些愿意在底层优化的“重体力劳动者”,才是跨越周期的硬通货。

3. 别慌!AI永远无法被“吊销律师执照”

聊到大家最焦虑的“程序员要失业”问题,Vlad给出了一个堪称“暴击”的观点。

他举了个例子:现在的法律大模型可以背下所有判例,但它能代表你出庭辩护吗?不能。因为AI没有被“吊销律师执照”的资格。

因为它不具备主体资格,无法承担法律责任。 代码的终点永远需要一个具体的人来签字、背书并承担责任。”1

这个比喻简直绝了。职业的底层逻辑是责任和信任的分配。AI能帮你写代码,能帮你审合同,但当系统崩了、项目黄了、法务函来了的时候,背锅的只能是人。你见过有AI被送进监狱的吗?

所以,Vlad认为,对程序员来说,真正该做的不是担心被替代,而是思考怎么“利用”AI让自己更高效。他团队里的核心骨干Nate Lintz,之前就是个写搜索后端基础架构的普通码农,正是在业务里死磕大模型的落地和推理开销,硬生生把自己“卷”进了DeepMind,成了技术支柱。1

4. 想进DeepMind?先做道“硬核作业”

最后,Vlad还给那些羡慕他团队的人指了一条“野路子”。

他公开了一个招聘“福利”:如果你能手写一个Transformer,并且手算Scaling Laws(缩放定律),录成视频发给他,只要你做的够牛逼,他直接面试你。1

这作业光听起来就头皮发麻。但这恰恰说明了Vlad的用人逻辑:在AI时代,真正的护城河不是你会调多少API,而是你能否深入到系统的最底层,理解那些“脏活累活”的运行逻辑。

不要被所谓的“AI恐惧营销”带着走。与其内耗,不如“做那个别人会真心希望你成功的人”。哪怕只是从修一个Bug、优化一段显存开始。

那才是真实世界里,通向“前沿”的通行证。

引用