ChatGPT“王座”被掀?Google这套AI全家桶,个个都是“时间刺客”!

温故智新AIGC实验室

TL;DR:

本以为ChatGPT会一直“高处不胜寒”,结果Google Gemini带着它的“全家桶”AI工具,硬生生把榜一给“撬”了!从神仙P图到电影级视频,再到你的私人学习助理,Google这次真的亮出了“王炸”组合,誓要让你告别“无效打工”!

还记得前阵子,各大科技媒体还在为ChatGPT的“神仙操作”拍手叫好,以为它将永远稳坐App Store免费榜的“头把交椅”?嘿,科技圈的反转总是来得猝不及防!这周,Google Gemini就凭借着近期爆火的Nano Banana图像编辑功能,上演了一出“后来者居上”的好戏,直接把ChatGPT“挤”到了第二名,成功登顶App Store免费榜。

这波操作,简直是Google的“高光时刻”啊!难道说,沉寂了一段时间的Google AI,终于要开始“放大招”了?别急,Gemini只是个开胃菜,Google这次摆出的,可是一桌丰盛的AI“全家桶”。从帮你写稿、画图,到学习笔记、视频生成,甚至命令行操作,一应俱全。今天,我们就来扒一扒,Google这套“时间刺客”们,到底藏了多少“杀手锏”!

旗舰担当:Gemini,不只是个“聊天搭子”!

说起Gemini,大家第一反应可能还是那个智能聊天助手。但如果你只拿它来“瞎聊”或者P图,那可真是暴殄天物了!这次App Store的登顶,Nano Banana功不可没。这个图像编辑模型,简单几下就能把你的照片“魔改”得栩栩如生,难怪能瞬间俘获用户芳心。

但Gemini的野心显然不止于此。它现在已经补齐了跨对话的“记忆”功能,意味着它能记住你之前聊过的话题,上下文理解能力直线飙升。这不就是咱们打工人梦寐以求的**“智能备忘录”**吗?而且,它还能和Google生态无缝衔接,想想看,你的邮件、文档、日历,都能被一个AI助手统一管理,是不是有点“赛博管家”那味儿了?

在模型表现上,Gemini 2.5 Pro最大的亮点,是它能给出像DeepSeek一样清晰的推理过程,而且速度快得飞起1 相比之下,ChatGPT在升级到GPT-5后,虽然采用了“路由控制”自动选模型,但有时候你也不知道它到底想用哪个模型来回答,沟通起来像是在“猜谜”。

不过,“更会聊天”的代价,目前来看可能是“更不会干活”。在一些网页开发能力上,Gemini暂时还不及GPT和Claude。但Google最近可是狂给Gemini“打补丁”,用户体验肉眼可见地在提升。比如,Gemini Canvas画布现在支持直接点选应用中的元素,用大白话就能修改,这简直是把“所见即所得”玩到了极致!2 更让人惊喜的是,Gemini终于支持上传音频文件了!会议录音、采访视频,直接丢给它,省去了多少手动整理和编写复杂提示词的麻烦,简直是“懒癌患者”的福音啊!

悄悄透露一个内部消息,据Flowith创始人Derek Nee和Gemini 3工程师团队交流,Gemini 3.0 Flash的能力,有望超越现在的2.5 Pro。看来,未来的“聊天搭子”,只会越来越强!

知识管理“神器”:NotebookLM,告别“下次一定”!

是不是有那么一堆下载了就再也没打开过的英文长文、书摘? NotebookLM就是来拯救你这些“吃灰”资料的!它简直是个人知识库的“最佳伴侣”,你只需要把最多300个文件(PDF、txt、Markdown甚至音视频统统搞定)一股脑丢进去,它就能:

  • 自动提炼要点,生成条理清晰的学习笔记,告别“重点在哪儿”的迷茫。
  • 如果你是“视觉动物”,它还能直接画出思维导图,让你一眼看懂文章脉络,效率瞬间MAX。
  • 想巩固学习成果?没问题!它还能基于这些资料出小测验,甚至生成闪卡,像个严厉的“家教”,逼你复习巩固

想象一下,你上传了297篇同一研究领域的论文,NotebookLM能瞬间生成文字报告、播客预览、视频介绍、思维导图、闪卡和小测验六种形式的总结。1 从概述到深入,从辩论到批判性思考,各种类型应有尽有。甚至还能与OpenStax等免费教科书平台合作,把枯燥的教材变成互动式学习笔记本。这种“一站式”知识消化能力,简直是学生党和研究者的**“天降神兵”**!

AI视频“卷王”:Flow/Veo 3,直击短视频C位!

AI视频生成的热度一直居高不下,但很多时候我们都会问:“这玩意儿到底能用来干啥?”Google这次用Flow(主要由Veo 3模型驱动)给出了一个响亮的答案:直击短视频C位!

Veo 3最近的更新,直接支持了竖屏(9:16)和1080p高清视频生成1 这意味着什么?这不就是为抖音、YouTube Shorts、Reels这些短视频平台量身定制的吗?以往我们看到的AI视频可能还停留在“尝鲜”阶段,但现在,它正大步迈向成为一种新的内容消费品。与其被动“围观”,不如亲自上手“卷”起来!

Google搜索也证实,Veo 3是Google最先进的模型,能够从文本提示生成高质量的8秒视频,并且支持声音。34 更牛的是,在Gemini应用中生成的视频,会自动带有可见水印和SynthID数字水印,明确标识其AI生成身份,这在AI伦理和溯源方面,也算是给用户吃了一颗“定心丸”。

前段时间爆火的“第一视角穿越”、“ASMR切水果”、“兔子蹦床夜视监控”等视频,很多就是出自Veo 3之手。但要生成高质量视频,提示词的优劣才是关键瓶颈。Google官方也给出了“秘籍”:好的提示词通常包含相机(如“50mm相机、特写镜头”)、具体内容描述,以及明确的灯光和纹理细节。学会“精准投喂”,你也能成为AI视频的“魔法师”!

搜索升级“超进化”:AI Mode,Google要让你“懒”到极致?

搜索作为互联网最大的流量入口,自然成了AI大厂的“兵家必争之地”。微软Edge已经把Copilot嵌入浏览器,OpenAI也被爆料要做自己的AI浏览器,Google怎会袖手旁观?

区别于我们平时见到的Google搜索AI Overview(AI总结),AI Mode更像是一份“深度研究报告”。它利用Gemini 2.5的高级推理和多模态能力,来处理我们的查询,给出比简单总结更严谨、更翔实的结果。当你问它“iPhone Air的eSIM卡到底是怎么回事”时,它能自动根据网页内容整理,给出更准确的答案,而不是简单的罗列信息,这简直是把“帮你思考”做到了极致。

唯一的“小遗憾”是,目前AI Mode还不支持中文。不过Google已经宣布支持日语、韩语、葡萄牙语等五种语言。他们提到,构建全球化的AI搜索不仅仅是翻译,更要考虑到本地相关性和实用性。看来,咱们中文用户“躺平”用AI Mode的日子,应该也不远了。

开发者的“秘密武器”:Gemini CLI,真香警告!

“Claude Code断供了怎么办?”“没事,Gemini CLI才是真的香!” 这句网络流行语,完美诠释了Gemini CLI的魅力。以前我们觉得终端工具是程序员的专属,但现在,Gemini CLI简直是把命令行变成了你的“万能助手”

下载X视频、YouTube视频,视频转GIF,各种格式转换,图片压缩、视频压缩……这些原本需要你打开好几个网站、下载N个工具才能搞定的事,现在只需要在终端里用自然语言说一声,Gemini CLI就能帮你一键搞定1

安装流程相当清晰,即便你是Windows用户(终端体验确实不如macOS和Linux友好),只要有点耐心安装Node.js,按照GitHub指引运行命令,就能轻松上手。免费用户每分钟60次请求,每天1000次请求,应付日常工作流绰绰有余。

最有意思的是它的“记忆”功能。如果你不小心让它删了原文件,下次再犯错时,它会修改自己的gemini.md配置文件,记住这个“教训”,确保未来不再犯同样错误。这不就是一个会学习、会成长的“AI小跟班”吗”1 再结合MCP(大模型上下文协议)这个“万能接口”,Gemini CLI能做的,远远不止是编程开发,简直是把你的电脑变成了“智能魔盒”!

未来实验室“尝鲜”:AI Studio 和 Labs Google,前方高能!

Google Labs就像一个神秘的“宝藏库”,汇集了许多尚未正式发布的AI黑科技。像我们前面提到的AI Mode和NotebookLM,其实目前都还挂着“实验室产品”的标签,但它们的名声已经如雷贯耳了。

这里还有不少好玩的小项目:

  • Whisk:这个主打“不需要提示词,上传照片尽情玩耍”的图片生成工具,现在还新增了animate动画功能,直接把生成的图片转成视频,让你的创意“动”起来!1
  • Little Language Lessons:它打破了传统语言学习的“死板套路”,让你在Gemini构建的小实验里,直接在现实场景中学习新语言和各种俚语。我拿粤语试了一下,总算不是多邻国里来来回回的“肠粉和豉汁排骨”了,简直是“接地气”的学习体验!1

当然,最前沿的模型体验,还得去AI Studio。比如最新的Imagen 4图像生成模型,目前只能通过Gemini API和AI Studio来体验。AI Studio还有一个特别的“分支”功能,你可以保留现有对话,同时开启一个新话题,这对于多任务处理和创意探索来说,简直是**“神来之笔”**!

前段时间,马斯克还在X上和奥特曼“互撕”,抱怨Apple和奥特曼有“私下交易”,凭什么ChatGPT一直霸榜,他的Grok就登顶不了第一。1 这一番开箱下来,我们似乎能看到Google Gemini“凭什么”的端倪了。

Google AI正在用一套完整且无缝的工作流,悄悄融入我们的学习、工作和创作之中。从海量资料的整理到灵感的激发,再到解放双手进行繁琐操作,这套“AI全家桶”的核心目的,就是希望实实在在地提升每个人的生产力。这不只是技术的较量,更是对未来生活和工作方式的重新定义

引用


  1. 文章内容,图片均来自 APPSO (AI有用功) (2025/9/15) · 检索日期2025/9/15 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Gemini 画布新增功能,选择并询问 · Gemini App (2025/9/15) · 检索日期2025/9/15 ↩︎

  3. Make videos with Gemini-CLI, Nano Banana, and Veo3 · LinkedIn · John Capobianco (2025/9/15) · 检索日期2025/9/15 ↩︎

  4. Generate videos with Veo 3 in Gemini API · Google AI for Developers (2025/9/15) · 检索日期2025/9/15 ↩︎