“香蕉”终于扒皮了!谷歌认领“AI版Photoshop”,网友:P图自由要来了?

温故智新AIGC实验室

TL;DR:

那个神秘到让P图圈“卧槽”的“香蕉模型”终于露出真面目了,原来是谷歌家的Gemini 2.5 Flash Image!它不仅能把猫P遍全世界,还能2D转3D,连复杂的图像推理都不在话下。Photoshop看了可能要喊“危”,P图自由,指日可待!

最近P图界有个神秘的“狠角色”——nano-banana模型,在网上掀起了惊涛骇浪。各路大神纷纷晒出它的“神仙操作”,让无数吃瓜群众直呼“YYDS”!然而,这个“香蕉”到底是谁家的,一直是未解之谜。

就在今天,谜底终于揭晓!谷歌大手一挥,傲娇地官宣:不好意思,这根“香蕉”是我们家的Gemini 2.5 Flash Image啦! 那个爆火的神秘图像编辑模型,终于脱掉了它“犹抱琵琶半遮面”的“香蕉皮”,以真面目示人。现在,它已经在Gemini和Google AI Studio上免费开放给全球玩家体验,API调用更是良心价,每张图像只需0.039美元(折合人民币约0.28元),简直是白菜价的“P图神器”啊!1

那么,这根“谷歌牌香蕉”究竟有多“甜”,能让P图圈“炸”成这样?

“香蕉”不只甜,还能“P”出新高度!

首先,它的图像编辑能力简直是把**“常规操作”玩出了花**。除了那些你懂的修图技巧,Gemini 2.5 Flash Image还能合并最多三张图片,脑洞大开地创造新事物。想生成超现实艺术?小意思!组合不同照片元素?分分钟!无缝融合物体、颜色和纹理?那更是它的拿手好戏。你甚至可以用几张照片,生成堪称电影画面的连贯剧情故事,简直是导演梦的平替!

但这还没完。在谷歌官方认领之前,网友们就已经被nano-banana的各种“私家case”秀得头皮发麻。比如,它能精准地改变面部表情和天气,让阴天秒变晴天,哭脸变笑脸,简直是情绪管理的AI大师。更夸张的是,它还能让秃头男人重新拥有不同发型,这下植发中心的生意可能要受影响了(开个玩笑)。

当网友们喊出“PhotoShop岌岌可危”的时候,我们才发现,这根“香蕉”的野心远不止于平面图像编辑。它竟然还能进行2D到3D的转换!你只需提供一张普通的2D图片,系统就能自动生成相应的3D视角,每一个角度都恰到好处,和谐统一,就像变魔术一样。

但最最最让人佩服的是,它还具备了“图像推理”的超能力。勾股定理?小意思!计算角度?手拿把掐!识别图像里的水母结构?瞬间反应,堪称**“你画我猜AI版”**!

“说实话,最让我佩服的是,当我们要求此‘香蕉’给出一个人从A到B的方案时,它竟然直接生成一个梯子!”

好家伙,这不只是P图,图像编辑器真的能“思考”了!

我们自己也实测了一下这款模型,发现它确实很有意思:

  • 给它一只猫猫,提示词“以这只猫为主角,生成旅游照”,它能让猫猫瞬间“环游世界”,从埃菲尔铁塔到故宫,哪里都能打卡2
  • 如果不想做真实场景,让林黛玉和孙悟空成为漫威英雄并肩战斗,也就一句话的事儿,次元壁瞬间被打破。
  • 它对光影的细节理解也相当真实。比如,提示“一根香蕉被放在厨房台面上,旁边有水杯、刀具和切菜板,阳光从窗户照进来,香蕉投下自然阴影”,生成结果中,阳光透过水杯折射的影子、旁边植物的影子都自然合理,细节控表示很满意。
  • 它还能很好地抓取角色特征,并进行出人意料的改变:如果那一年,工藤新一喝下的并不是缩小药水,而是……(不敢想不敢想)。

神秘“香蕉”:谷歌这波营销,玩得有点野?

话说回来,这根“香蕉”为啥一开始要“匿名出道”呢?

Nano Banana最初出现在一个叫LMArena的网站上,那是一个让不同AI模型匿名进行“战斗模式”竞赛的平台。它之所以爆火,无他,就是因为表现实在太!好!了! 这又是一个SOTA(State-Of-The-Art,当前最佳)级别的图像编辑模型,而且在一开始没有任何官方文档,就这么“横空出世”,让网友们好奇心爆棚。

不过,在谷歌官方实锤之前,一些眼尖的“福尔摩斯”们已经猜到了这是谷歌家族的一员。一方面,它的表现与Gemini近期发布的多模态版本太像了,这样出色的性能,很难是“车库团队”能捣鼓出来的。另一方面,它的发布策略——匿名发布、无品牌标识、让用户群体自行探索——与DeepMind早期在匿名测试平台上评估大语言模型的方式如出一辙,简直是**“祖传套路”**。当然,还有点“八卦”原因:一些与谷歌有关联的开发者在社交媒体上发了奇怪的香蕉内容🍌,这波暗示,懂的都懂!

有网友问谷歌为什么要选择秘密发布,官方给出的解释是:正在为全球规模的发布做准备工作。 嗯,这理由很“谷歌”,也很“凡尔赛”!

网友:我的“P图自由”何时才能完全实现?

既然官方都这样说了,网友们也坐不住了,纷纷表示:

“那我们能用完整版了吗?”

这求“完整版”的心情,简直溢出屏幕!

不过,虽然这个模型在图像生成的表现确实强大,但也并非没有槽点——尤其在大公司的服务政策下,很容易出现一些让人比较“抓狂”的情况。有用户反映,有时候会因为“安全策略”而被拒绝生成图片,比如涉及某些敏感词汇或被系统误判为不当内容时,就会直接“拒生成”。这种**“AI老大哥”式的审查**,确实让一些创意玩家感到不便。

但总的来说,不少网友认为,谷歌这波操作,简直是**“教科书式的营销案例”**。先用神秘的“香蕉”吊足胃口,让用户自发传播,再官方认领,成功地把一个顶级AI模型推向了大众视野。这波流量,谷歌赚麻了!

感兴趣的朋友,不妨去Gemini和Google AI Studio亲自体验一下这根“香蕉”,哦不,是Gemini 2.5 Flash Image。说不定,你的P图世界就此打开了新大门呢!

引用


  1. 谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线·aitntnews.com·(2025/8/27)·检索日期2025/8/27 ↩︎

  2. 谷歌认领最强AI版Photoshop,现在人人可用,效果确实强悍·36氪·不圆 时令(2025/8/27)·检索日期2025/8/27 ↩︎