Gemini 3.0“马甲”LMArena被扒:AI界“卷王”驾到,这回真能看懂表了?

温故智新AIGC实验室

TL;DR:

谷歌Gemini 3.0的俩“马甲”——lithiumflow和orionmist悄咪咪上线LMArena竞技场,被网友一顿狂扒。实测发现,这哥们儿不光能作曲、能画SVG,最牛的是,它竟然是第一个能准确看懂复杂钟表的AI,直接把隔壁GPT-5给“秒”了,看来谷歌这回真要硬气一把了!

AI圈最近是真热闹,大模型们你方唱罢我登场,每次新秀露面,总少不了在LMArena这个“华山论剑”的竞技场上,让各路“武林高手”来过过招。这不,一直活在传说中的谷歌Gemini 3.0,最近也按捺不住寂寞,悄悄地派出了两位“马甲”选手——lithiumflow(疑似Gemini 3.0 Pro)orionmist(疑似Gemini 3.0 Flash),在LMArena上提前跟全球网友say hi了。

图片:谷歌Gemini 3.0疑似上线LMArena

消息一出,那还得了?网友们纷纷化身“福尔摩斯”,冲进竞技场一顿猛薅,希望能撞上这两个“稀有怪”。从目前扒出来的实测结果来看,Gemini 3.0这次是真的有点东西,甚至可以说有点“凡尔赛”了。

“时间刺客”上线:AI终于不“脸盲”了?

你可能觉得,看个钟表有啥难的?但对AI来说,这简直是个史诗级难题!アナログ钟表不像数字时钟那样直观,它涉及指针长短、指向、分钟间隔、甚至各种稀奇古怪的表盘样式,这些都是AI多模态理解的**“硬骨头”**。此前,无数AI都曾在这个问题上“翻车”,上演一出出“AI发癫”的大戏。

然而,Gemini 3.0 Pro(就是那个lithiumflow)这次却给所有人上了一课。在LMArena的实测中,它竟然精确无误地识别出了钟表显示的时间:6点02分30秒

“AI第一次看懂钟表,简直是历史性一刻啊!”(网友@synthwavedd如是说)1

同样的问题,友商家的GPT-5 Thinking直接“发癫”,把时间误读成12:30,时针分针傻傻分不清楚。连自家的Gemini 2.5 Pro也跟着“发疯”,识别结果一言难尽。这波对比,Gemini 3.0 Pro直接完成了对前辈们的**“降维打击”**,可以说是AI界的“时间刺客”本人了。

“鹈鹕梗”又来了!SVG绘画,是进步还是“卷”过了头?

大模型新版本上线,SVG测试这道“传统艺能题”是绝对躲不过的。SVG,全称可缩放矢量图形,它能让AI画出的图像无论放大多少倍都不会失真,这可是检验AI视觉理解和生成能力的重要指标。

这次Gemini 3.0 Pro在SVG测试上的表现,初看确实可圈可点。它生成的画面表现力比之前测试的模型提升了不止一个档次,甚至带着点**“抽象派艺术家”**的风格,让网友直呼“有内味儿了”。

当然,最经典的那个**“骑自行车的鹈鹕”meme也必须安排上。Gemini 3.0这次把自行车画得是真不错,鹈鹕也栩栩如生。不过,一个值得玩味的现象是:这个“骑自行车的鹈鹕”梗,似乎已经成了各家AI模型心照不宣的“考点”。为了在这道题上拿高分,不少模型可能都悄悄进行了“微调”**。所以,当其他竞技场里的模型都能“完美”画出鹈鹕骑自行车的画面时,反而让Gemini 3.0那带点“抽象”的风格显得有些“不那么完美”了。这究竟是AI在“卷”出新高度,还是在逐渐丧失自己独特的“个性”呢?值得我们思考。

会作曲的AI:文艺青年们,饭碗要保不住了吗?

除了“看表”和“画画”,Gemini 3.0 Pro还悄悄解锁了一项新技能——作曲!这货竟然能模仿多种音乐风格,长时间保持节奏,甚至还能自己玩出点活力和变奏。

有网友评价,这是“第一个相当体面的作曲模型”。

想象一下,你随便哼几句,AI就能给你即兴创作一首完整的曲子,那岂不是要让一众“打工人”音乐家们开始“emo”了?虽然目前大部分实测音乐效果还在初期阶段,但AI在艺术创作领域的步子迈得越来越大,已经是不争的事实。未来,AI能否成为真正的“作曲大师”,我们拭目以待。

“马甲”身份大揭秘:为什么是它俩?

这些“马甲”是怎么被扒出来的?又是怎么确定它们就是Gemini 3.0呢?这就不得不提到AI圈的“侦探网友”们了。有细心网友发现,“Orion”本身就可能与Gemini 3.0存在关联,再加上“orionmist”这种由两个单词合成的命名方式,恰好是谷歌AI团队惯用的“隐藏身份”套路2

而且,在LMArena上线之前,关于Gemini 3.0的各种内测案例就已经在开发者社区里“满天飞”了。比如,有人爆料它能用一个HTML文件模拟出完整的MacOS或Windows系统UI交互,甚至只用1分钟就能用SVG生成一段风格动画。这些“神仙操作”,都预示着Gemini 3.0绝非等闲之辈。

谷歌的“逆袭”之路:LMArena只是序章?

谷歌的Gemini 2.5发布至今也快一年了,在OpenAI接连打出GPT-5和Sora 2这两张“王炸”后,谷歌似乎只跟了一张“Veo 3.1”。这让外界对谷歌大模型的进展颇为关注。而这次Gemini 3.0“马甲”在LMArena的出现,无疑是谷歌正式发布前的“试水”和“预热”。

根据此前网友的爆料,谷歌下一代旗舰模型Gemini 3.0很可能在10月22日正式发布。这波LMArena的实测,无疑是为正式发布造势,也让大家对谷歌这次能否“硬气一把”,不再“跟着OpenAI跑”,充满了期待。

从多模态AI的视角来看,Gemini 3.0确实展现出了强大的整合能力,它不仅能处理文本、图像、音频,未来甚至可能覆盖视频处理,实现更自然的人机交互体验3。目前,LMArena榜单上腾讯混元图像3.0模型表现抢眼4,可见AI大模型领域的竞争已经进入白热化阶段。

总的来说,虽然Gemini 3.0确实在看表、画SVG、作曲这些方面进步神速,但整个AI圈的“传统艺能”也越来越固定了——先传风声、再上LMArena、然后一堆人去撞马甲、测SVG、看谁更像真货。看多了,也确实有点“腻”了。毕竟,无论是Gemini 3.0、GPT-5还是Claude新版本,最后都还是那一套“实测截图+prompt对比+看图说话”。模型越来越聪明,但我们的评测方式似乎还停在“老套路”上。

希望下一次,不只是模型更强,而是真的能玩出点新花样,别让这波AI热潮变成无止境的**“内卷”**。

引用


  1. X.com/@synthwavedd·synthwavedd(2025/10/20)·检索日期2025/10/20 ↩︎

  2. 谷歌AI Gemini 3.0,下一代人工智能的突破与未来展望·谷歌Gemini官网(2025/10/20)·检索日期2025/10/20 ↩︎

  3. 谷歌ai gemini3.0_谷歌Gemini官网·谷歌Gemini官网(2025/10/20)·检索日期2025/10/20 ↩︎

  4. 腾讯混元图像3.0登顶LMArena榜首 - 中关村在线·中关村在线(2025/10/20)·检索日期2025/10/20 ↩︎