TL;DR
谷歌新出的Gemini 3.5 Flash,速度是快,但脑子不行——又贵又啰嗦,还“污染”了搜索、AI Overview全家桶。用户吐槽到飞起,谷歌赶紧出个Low版本压惊。不过别急着笑,谷歌在硬件上(TPU)竟悄悄支棱起来了,成了“卖铲子”的赢家。
距离谷歌I/O 2026上皮查伊吹爆Gemini 3.5 Flash已经过去一周多了。当时他满脸自信:“3.5 Flash性能比3.1 Pro还强,是Agent时代的底座!”1
然后呢?现实给了谷歌一记响亮的耳光。
网友的评价非常统一:快是真的快,但蠢也是真的蠢。
输出内容错误多、啰嗦得像老太太的裹脚布、干活时token消耗量直接爆炸——用过的都在骂。谷歌Antigravity负责人瓦伦·莫汉(Varun Mohan)赶紧在5月25日发帖救火,说新增了Gemini 3.5 Flash (Low) 模型,能减少约45%的token生成量。2
评论区瞬间被嘲讽攻占。热评第一条:“你们的产品测试过吗?看起来你们是在拿我们做测试啊!”第二条更狠:“能不能也解决一下图像模型的数量限制?我用Codex能生成1000张,你们高级套餐只给24张。”2
这画面,像极了学霸突然翻车,全班围观。
速度是遮羞布,内核全是坑
皮查伊在发布会上反复强调模型多便宜——每百万输入token收费1.5美元,确实比Claude Opus 4.7的5美元便宜不少。但那是单位token价格,真正决定你钱包的,是完成一个任务要消耗多少token。
Independent测试机构Artificial Analysis直接打脸:Gemini 3.5 Flash完成全套评估任务的总成本是1552美元,而Gemini 3 Flash只要282美元,前者是后者的5.5倍。甚至比GPT-5.5 medium还贵。3
原因?Flash模型每做一个任务平均需要49轮对话,每一轮都把完整历史喂进去。而GPT-5.5或Opus 4.7只要20轮左右。更离谱的是,它输出啰嗦到令人发指——问个技术问题,先解释背景、再列三种方案、然后逐一分析、最后才给代码。全程废话,但每个字都算token,都要收费。2
有用户反映做多步骤代码重构,反复在不同文件跳转,token消耗是预期的三倍以上。还有人输入一个复杂prompt,直接触发5小时使用限制——谷歌悄悄把AI Pro订额度从固定消息数改成了基于计算资源的配额(compute-based quota),你根本算不清剩多少算力。2
用网友的话说:“可能我只是跟它打个招呼,就花掉13%的配额。”2
更可怕的是,它“污染”了谷歌全家桶
皮查伊在I/O上宣布,Gemini是谷歌全产品宇宙的连接层。翻译成人话:Gemini 3.5 Flash被塞进了搜索、AI Overview、Workspace、Android Studio等几乎全部产品。
过去AI不好用,你可以不用。但谷歌把所有入口都占了,你躲都躲不掉。
最经典的例子是AI Overview的“disregard/ignore/stop”故障。用户搜“disregard”,AI Overview不是给定义,而是回复“明白了!我会忽略之前的提示,重新开始。”搜“stop”说“没问题,已停止。”搜“ignore”说“消息已忽略。”2 — 这哪是搜索引擎,分明是个傻乎乎的聊天机器人。
谷歌回应说是AI Overviews自身问题,但所有人都觉得:“谷歌要凉了。”2
搜索是谷歌的命根子。一旦搜索出问题,用户信任崩塌的速度比AI推理快多了。
压力全给了3.5 Pro
目前Gemini 3.5 Pro还在内部测试,官方说6月推出。1 谷歌产品负责人图尔西·多希(Tulsee Doshi)打了个比方:3.5 Pro像项目经理,负责想清楚怎么做;Flash像执行团队,负责跑任务。 2
这个架构本身没问题,问题在于Pro还没出来,Flash一个人苦苦硬撑。如果3.5 Pro表现出色,高通还能圆过去——话术我都替谷歌想好了:“全线嵌入Flash是个尝试,给大家造成不好的体验,但3.5 Pro绝对好用!”可如果3.5 Pro也不行,那谷歌在AI战场算彻底溃败。2
别急,谷歌在硬件上悄悄“支棱”了
不过谷歌并非一无是处。2026年Q1财报亮眼:收入1099亿美元,同比增长22%;Cloud收入200亿美元,增长63%。4 皮查伊说“Cloud增长是强劲需求的结果”,本质就是:TPU硬件和数据中心卖得非常火。
Anthropic已经跟谷歌签了多年协议,租用多达100万个TPU芯片,价值数百亿美元。谷歌还发布了第八代TPU:TPU 8t(训练专用)和TPU 8i(推理专用)。5
TPU 8t目标是goodput超过97%,也就是让训练时间真正用在干活上,少中断。TPU 8i则针对Agent设计,有384MB板载SRAM,让短期记忆读取更快。5
微软预测到2028年将有13亿个Agent运行,谷歌提前布局Agent推理芯片,思路很清晰。
但问题来了:Anthropic用谷歌的TPU造出了Claude Opus 4.7甚至更强的Mythos,谷歌自己拿出来的却是Gemini 3.5 Flash这种半成品。 2
橘生淮南则为橘,生于淮北则为枳。谷歌手里的牌不差,就是打不出去。
现在的局面微妙又讽刺:作为互联网巨头,谷歌在AI软件上翻车,却靠卖TPU硬件赚得盆满钵满。如果3.5 Pro再拉胯,谷歌怕是要认真考虑——要不干脆转型卖铲子算了?
引用
-
Gemini 3.5 Flash - Google DeepMind · Google DeepMind (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎
-
谷歌全家桶,都被新模型“污染”了 · 字母AI · 苗正 (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Gemini 3.5: frontier intelligence with action · Google Blog (2026/5/27) · 检索日期2026/5/27 ↩︎
-
谷歌2026年Q1财报数据,引自原文片段 ↩︎
-
TPU 8t & TPU 8i announcement · Google Cloud Next 2026 (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎