谷歌终于支棱起来了?Gemini 3.5 Pro提前曝光,但“追平GPT-5.5”是喜是忧?

温故智新AIGC实验室

TL;DR:

谷歌的Gemini 3.5 Pro被网友提前扒了个底朝天,代号“卡布奇诺”,不仅编程能力追平了GPT-5.5,还搞出了一个24小时在线帮你花钱、管邮件的AI管家“Spark”。但坏消息是,谷歌的模型性能只能“追平”,而对手们早就开始卷“超越”了。这波操作,到底是逆袭还是陪跑?

代号“卡布奇诺”上线,谷歌这次不拿铁了?

AI圈的“吃瓜”速度,永远比你想象的快。就在谷歌I/O大会前夕,一位名叫Lentils的网友直接来了一波“全网首曝”,把谷歌还没捂热乎的新模型——Gemini 3.5 Pro,连代号带截图全给抖搂了出来。1

这个新模型的代号相当小资,叫“Cappuccino”(卡布奇诺)。要知道,就在几个小时前,大家还在猜是Gemini 3.2,结果谷歌直接跳级到了3.5。这种命名操作,说白了就是想告诉大家:别拿豆包不当干粮,我们这次要搞个大新闻。

从泄露的截图来看,Gemini 3.5 Pro确实有点东西。以前你让它画个SVG(矢量图),它可能就敷衍你一个。但现在,一个prompt,它能给你整出四个风格迥异的机器人,细节多到能让你以为设计师在加班。更离谱的是,它甚至通过一个prompt直接生成了一个具备交互能力的Web应用——比如那个DualShock 4手柄的拆解蓝图,你可以实时调车架颜色、光照、甚至蹬车速度。2

这波操作直接治好了Gemini的“懒癌”,也说明谷歌在蒸馏加稀疏化技术上确实下了血本,把大模型压成轻量版,质量却没跳水。

性能“追平”GPT-5.5:到底是喜报还是“小丑牌”?

先别急着欢呼,高潮之后往往是反转。

知名爆料人Alex Heath通过多个信源确认了一个让人有点五味杂陈的消息:新Gemini的性能,最多只能追平OpenAI的GPT-5.5。 3

等等,半年前的Gemini 3 Pro不还是横扫排行榜的“卷王”吗?怎么半年后,就成了只能“追平”的追赶者?

这就像你上学期考了年级第一,这学期发现大家都在偷偷补课,你虽然还是那个分数,但名次已经掉到了第三。背后的原因很残酷:OpenAI的GPT-5.5、Anthropic的Opus 4.7,以及那个“怪物”级别的Mythos,已经重新定义了天花板。 英国AI安全研究所(AISI)甚至表示,他们的测试框架已经快跟不上Mythos的能力了。

所以,对于谷歌来说,“追平GPT-5.5”这个成绩,看似是喜报,实则是一张“好人卡”——你很强,但你不是最强。

Gemini Spark:那个24小时在线、可能替你花钱的AI管家来了

虽然模型性能没登顶,但谷歌在另一条赛道上杀疯了——AI Agent(智能助手)

被扒出来的“Gemini Spark”,号称是谷歌版的“24/7数字生活管家”。这玩意儿有多猛?你睡觉的时候它醒着,你上班的时候它也在,全天候待命帮你收邮件、订外卖、甚至管理多步骤工作流。4

但最刺激的是它的权限描述。Spark可以连接你的Google应用、聊天记录、位置信息,甚至能直接调用你的登录凭证去执行任务。官方说,它会在“敏感操作前征求许可”,但底下还有一行小字:“可能未经询问就分享你的信息或完成购买。”

这不禁让人倒吸一口凉气。以前是“偷走我的心”,现在是“它可能不问你就偷走你的钱”。虽然这代表了未来人机交互的终极形态——自然语言替代鼠标点击,但留给用户的隐私焦虑,也随着Agent的自主权越来越大。

编程战场:DeepMind的“至暗时刻”?

最让DeepMind焦虑的,其实不是模型性能差一点,而是编程这个基本盘

根据泄露信息,Gemini 3.5在编程上追平了GPT-5.5,这是个好消息。但坏消息是,开发者的心早就不在谷歌这儿了。过去一年,Anthropic的Claude几乎成了程序员的首选,谷歌的AI编程平台Antigravity,花了4个月才拿下6%的开发者,跟Claude Code和Codex根本不在一个量级。5

更扎心的是,有评测直接把谷歌的AI编程比作“微软画图”级别的输出——能看,但没法用。而且,现在AI编程已经彻底出圈,产品经理都能用自然语言直接生成代码原型,谷歌却连个上桌打牌的资格都没有。

通往ASI的“军备竞赛”:三家同时踩油门,没人能刹车

尽管谷歌在模型和编程上略显疲态,但它手里有一张“王炸”——10亿级分发入口

Spark一旦铺开,海量的用户数据将反哺Gemini的下一代训练。这是OpenAI和Anthropic无论如何都复制不了的打法。所以,这场AI竞赛的形态已经非常清晰了:

  • OpenAI:靠迭代速度碾压,三周一个新版本。
  • Anthropic:靠模型质量封神,Mythos重新定义了“智能”的边界。
  • 谷歌:靠分发和Agent包抄,把AI塞进你手机里的每个角落。

三家在三条赛道上同时把油门踩到底。没人敢减速,因为通往ASI(超级人工智能)的飞轮,已经开始自转了。

对于每天用这些工具的我们来说,这可能是2026年最划算的一年——补贴在加码,模型在变强,价格在下降。 唯一的问题是,你的工作流,押对赛道了吗?



  1. 网友披露代号“Cappuccino”的Gemini 3.5 Pro检查点截图·新智元(2026/5/15)·检索日期2026/5/15 ↩︎

  2. Lentils在社交媒体发布Gemini 3.5 Pro交互式Web应用生成测试(2026/5/15)·检索日期2026/5/15 ↩︎

  3. Alex Heath独家爆料,新Gemini性能追平GPT-5.5(2026/5/15)·检索日期2026/5/15 ↩︎

  4. Google Prepares Gemini Spark AI Agent Ahead of I/O Launch·TestingCatalog(2026/5/15)·检索日期2026/5/15 ↩︎

  5. 腾讯云开发者社区·从“生成”到“深度推理”:2026大模型三巨头横评(2025/11/18)·检索日期2026/5/15 ↩︎