Google I/O 2026大杀四方:Gemini Omni“成精”了,你的手机明天可能多一个“AI打工人”

温故智新AIGC实验室

TL;DR:

谷歌在今年的I/O大会上,直接把AI全家桶拉满了。不仅搞出了个能凭空“变”出视频的Gemini Omni,还整了个24小时不睡觉的AI管家Gemini Spark。翻译一下就是:谷歌想让AI在你手机里“常住”,顺便在搜索结果里给你“画”个网页出来。

千呼万唤始出来,北京时间2026年5月20日凌晨,Google I/O 2026终于开幕。因为前阵子Google用The Android Show提前“分流”了Android 17的新功能,这也让AI终于能安心地当上本次大会的唯一主角。1

但谷歌的底牌,从来不是只做AI模型本身。它手里捏着Gemini、YouTube、Google搜索、Android这几个“生态入口”的王炸。所以,今年I/O的核心命题非常明确:如何用AI给这些亲儿子们“赋能”?

### 全能战士“成精”:Gemini Omni 和 3.5 Flash

这届谷歌发布会,在模型上直接扔了两颗“深水炸弹”。

首先是 Gemini Omni。这名字听着就很“全知全能”。谷歌官方的说法是:“Gemini Omni 能从任何形式的输入,获得任何形式的输出”。2

什么意思?我们举个例子:你在一张白纸上手绘一个圈,再写一句“在这个圈里变出一座漂浮的玻璃城市”,Gemini Omni就能直接给你输出一段完整的特效视频。这还不够,如果你觉得玻璃城市太土,想换成肥皂泡,它不仅能精准把你指定的元素换了,甚至还能给肥皂泡模拟出物理碰撞的“Duang Duang”效果。1

谷歌自己甚至开玩笑说,“Gemini Omni就像是视频领域的Nano Banana”。这比喻虽然有点抽象,但大概意思是:它已经牛到了一个极致——既能当“厨房刀”切菜,又能当“瑞士军刀”开瓶,还能当“菜刀”剁骨头。

紧接着,谷歌还发布了 Gemini 3.5 Flash。如果说Omni是“全能艺术家”,那3.5 Flash就是“闪电侠程序员”。根据现场演示,在谷歌新推出的AI开发环境Antigravity里,Gemini 3.5 Flash只用了12个小时就搭建了一个操作系统内核,整个过程的AI API成本还不到一千美元。13

一句话总结:谷歌这次把“多、快、好、省”四个字,全给凑齐了。

### 给你手机装个“AI管家”:Gemini Spark & 搜索的“生成式UI”

模型升级了,那基于这些模型的AI“打工人”自然也跟着起飞。

谷歌这次正式发布了面向个人用户的 Gemini Spark。这玩意儿有多“卷”?它是个7x24小时全天候托管你手机的AI Agent,跟你的手机和浏览器“寸步不离”。2

最重要的是,Gemini Spark 运行在专门的虚拟化环境中,通过MCP协议,它不仅能在谷歌全家桶(Gmail、Calendar、Docs)里随意穿梭,甚至能调起你手机里的第三方App。1 这意味着,你只需要说一句“Gemini,帮我下单上次那家店的拿铁”,剩下的打开外卖App、搜索店铺、加入购物车、确认付款等一系列操作,它全给你在后台干了。为了防止你被“黑科技”吓到,谷歌还专门搞了个 Android Halo 功能,在手机屏幕左上角常驻一个Agent状态标记,提醒你“你的AI管家正在工作”。1

但最让我这科技记者“拍大腿”的,是谷歌对搜索的“魔改”——生成式UI

平时用AI搜索,大多是给你一个文字框,你问它答。但如果你问的是“陀飞轮是怎么工作的?”怎么办?谷歌的做法是:我直接给你写一个能互动的3D交互网页,让你自己动手“拆”开看!1

这就很离谱了。它相当于把搜索结果从“告诉你有棵树”,变成了“直接在你面前种棵树,还允许你爬上去看看”。这背后的逻辑是,Antigravity的编程能力,加上Gemini 3.5 Flash的“Vibe Coding”能力,让搜索从“单向问答”直接跨进了“双向交互”的时代。可惜的是,这项功能要到2026年夏季才向所有用户开放。

### “物理器官”降临:音频眼镜与不便宜的AI订阅

除了软件,硬件也没落下。去年谷歌秀了带显示功能的AI眼镜,今年则带来了一款“音频版”智能眼镜。

别误会,它可不是那种只能听歌的玩意。这款眼镜搭载了摄像头和AI视觉能力,你可以直接用语音或触摸镜腿唤醒Gemini。比如,你走在街上,说一句“帮我买一杯上次点的咖啡”,眼镜会把指令传给手机,手机上的Gemini Spark自动完成下单,并在你声纹确认后完成支付。1

这一套组合拳下来,谷歌的“Gemini生态”已经初见雏形。但问题来了,这么强的算力,钱从哪来?

答案是:付费。

谷歌在原本的AI Pro(20美元)和AI Ultra(250美元)之间,硬生生插入了一个“青春版”AI Ultra(100美元),并且Gemini Spark是纯粹的全付费功能。1 这释放了一个非常清晰的信号:AI的尽头是算力,算力的尽头是烧钱。

### 写在最后:谷歌终于拿到了“门票”

纵观整场I/O,谷歌终于不再像过去两年那样,只是在AI赛道里“乱拳打死老师傅”。这一次,它清晰地摸到了AI时代的正确门票。

过去,AI硬件和AI软件是割裂的:硬件是硬件,AI是AI。而这次,凭借Gemini 3.5 Flash的多模态能力和Android底层的“特权”,Gemini终于把自己的这些硬件设备(眼镜、笔记本)变成了感知世界的“物理器官”。14

更重要的是,当海外的Anthropic还在沙盒机制的边缘试探时,Gemini已经在Android底层实现了“原生互通”。这既是谷歌的护城河,也是对国内AI企业的一记“提醒”:别光顾着卷模型了,赶紧学学谷歌,把AI“合法地”塞进手机系统底层里,搞起属于自己的“独立王国”吧。

毕竟,当你的手机里住进一个“AI打工人”时,你付的就不是软件订阅费了,而是“房租”的一部分。


  1. Google I/O全盘点:两大新模型上线,音频眼镜登台,Gemini接管一切·雷科技(2026/5/20)·检索日期2026/5/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. I/O 2026 - Google Blog(2026/5/20)·检索日期2026/5/20 ↩︎ ↩︎

  3. Innovations from Google I/O 26 on Google Cloud | Google Cloud Blog(2026/5/20)·检索日期2026/5/20 ↩︎

  4. Everything Announced At Google I/O 2026 - Engadget(2026/5/20)·检索日期2026/5/20 ↩︎