谷歌这波操作，把自己全家桶都“毒”了一遍

TL;DR

谷歌新出的Gemini 3.5 Flash，速度是快，但脑子不行——又贵又啰嗦，还“污染”了搜索、AI Overview全家桶。用户吐槽到飞起，谷歌赶紧出个Low版本压惊。不过别急着笑，谷歌在硬件上（TPU）竟悄悄支棱起来了，成了“卖铲子”的赢家。

距离谷歌I/O 2026上皮查伊吹爆Gemini 3.5 Flash已经过去一周多了。当时他满脸自信：“3.5 Flash性能比3.1 Pro还强，是Agent时代的底座！”¹

然后呢？现实给了谷歌一记响亮的耳光。

网友的评价非常统一：快是真的快，但蠢也是真的蠢。

输出内容错误多、啰嗦得像老太太的裹脚布、干活时token消耗量直接爆炸——用过的都在骂。谷歌Antigravity负责人瓦伦·莫汉（Varun Mohan）赶紧在5月25日发帖救火，说新增了Gemini 3.5 Flash (Low) 模型，能减少约45%的token生成量。²

评论区瞬间被嘲讽攻占。热评第一条：“你们的产品测试过吗？看起来你们是在拿我们做测试啊！”第二条更狠：“能不能也解决一下图像模型的数量限制？我用Codex能生成1000张，你们高级套餐只给24张。”²

这画面，像极了学霸突然翻车，全班围观。

速度是遮羞布，内核全是坑

皮查伊在发布会上反复强调模型多便宜——每百万输入token收费1.5美元，确实比Claude Opus 4.7的5美元便宜不少。但那是单位token价格，真正决定你钱包的，是完成一个任务要消耗多少token。

Independent测试机构Artificial Analysis直接打脸：Gemini 3.5 Flash完成全套评估任务的总成本是1552美元，而Gemini 3 Flash只要282美元，前者是后者的5.5倍。甚至比GPT-5.5 medium还贵。³

原因？Flash模型每做一个任务平均需要49轮对话，每一轮都把完整历史喂进去。而GPT-5.5或Opus 4.7只要20轮左右。更离谱的是，它输出啰嗦到令人发指——问个技术问题，先解释背景、再列三种方案、然后逐一分析、最后才给代码。全程废话，但每个字都算token，都要收费。²

有用户反映做多步骤代码重构，反复在不同文件跳转，token消耗是预期的三倍以上。还有人输入一个复杂prompt，直接触发5小时使用限制——谷歌悄悄把AI Pro订额度从固定消息数改成了基于计算资源的配额（compute-based quota），你根本算不清剩多少算力。²

用网友的话说：“可能我只是跟它打个招呼，就花掉13%的配额。”²

更可怕的是，它“污染”了谷歌全家桶

皮查伊在I/O上宣布，Gemini是谷歌全产品宇宙的连接层。翻译成人话：Gemini 3.5 Flash被塞进了搜索、AI Overview、Workspace、Android Studio等几乎全部产品。

过去AI不好用，你可以不用。但谷歌把所有入口都占了，你躲都躲不掉。

最经典的例子是AI Overview的“disregard/ignore/stop”故障。用户搜“disregard”，AI Overview不是给定义，而是回复“明白了！我会忽略之前的提示，重新开始。”搜“stop”说“没问题，已停止。”搜“ignore”说“消息已忽略。”² — 这哪是搜索引擎，分明是个傻乎乎的聊天机器人。

谷歌回应说是AI Overviews自身问题，但所有人都觉得：“谷歌要凉了。”²

搜索是谷歌的命根子。一旦搜索出问题，用户信任崩塌的速度比AI推理快多了。

压力全给了3.5 Pro

目前Gemini 3.5 Pro还在内部测试，官方说6月推出。¹ 谷歌产品负责人图尔西·多希（Tulsee Doshi）打了个比方：3.5 Pro像项目经理，负责想清楚怎么做；Flash像执行团队，负责跑任务。 ²

这个架构本身没问题，问题在于Pro还没出来，Flash一个人苦苦硬撑。如果3.5 Pro表现出色，高通还能圆过去——话术我都替谷歌想好了：“全线嵌入Flash是个尝试，给大家造成不好的体验，但3.5 Pro绝对好用！”可如果3.5 Pro也不行，那谷歌在AI战场算彻底溃败。²

别急，谷歌在硬件上悄悄“支棱”了

不过谷歌并非一无是处。2026年Q1财报亮眼：收入1099亿美元，同比增长22%；Cloud收入200亿美元，增长63%。⁴ 皮查伊说“Cloud增长是强劲需求的结果”，本质就是：TPU硬件和数据中心卖得非常火。

Anthropic已经跟谷歌签了多年协议，租用多达100万个TPU芯片，价值数百亿美元。谷歌还发布了第八代TPU：TPU 8t（训练专用）和TPU 8i（推理专用）。⁵

TPU 8t目标是goodput超过97%，也就是让训练时间真正用在干活上，少中断。TPU 8i则针对Agent设计，有384MB板载SRAM，让短期记忆读取更快。⁵

微软预测到2028年将有13亿个Agent运行，谷歌提前布局Agent推理芯片，思路很清晰。

但问题来了：Anthropic用谷歌的TPU造出了Claude Opus 4.7甚至更强的Mythos，谷歌自己拿出来的却是Gemini 3.5 Flash这种半成品。 ²

橘生淮南则为橘，生于淮北则为枳。谷歌手里的牌不差，就是打不出去。

现在的局面微妙又讽刺：作为互联网巨头，谷歌在AI软件上翻车，却靠卖TPU硬件赚得盆满钵满。如果3.5 Pro再拉胯，谷歌怕是要认真考虑——要不干脆转型卖铲子算了？

引用

Gemini 3.5 Flash - Google DeepMind · Google DeepMind (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎
谷歌全家桶，都被新模型“污染”了 · 字母AI · 苗正 (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Gemini 3.5: frontier intelligence with action · Google Blog (2026/5/27) · 检索日期2026/5/27 ↩︎
谷歌2026年Q1财报数据，引自原文片段 ↩︎
TPU 8t & TPU 8i announcement · Google Cloud Next 2026 (2026/5/27) · 检索日期2026/5/27 ↩︎ ↩︎