Gemini 3.0“马甲”LMArena被扒：AI界“卷王”驾到，这回真能看懂表了？

TL;DR：

谷歌Gemini 3.0的俩“马甲”——lithiumflow和orionmist悄咪咪上线LMArena竞技场，被网友一顿狂扒。实测发现，这哥们儿不光能作曲、能画SVG，最牛的是，它竟然是第一个能准确看懂复杂钟表的AI，直接把隔壁GPT-5给“秒”了，看来谷歌这回真要硬气一把了！

AI圈最近是真热闹，大模型们你方唱罢我登场，每次新秀露面，总少不了在LMArena这个“华山论剑”的竞技场上，让各路“武林高手”来过过招。这不，一直活在传说中的谷歌Gemini 3.0，最近也按捺不住寂寞，悄悄地派出了两位“马甲”选手——lithiumflow（疑似Gemini 3.0 Pro）和orionmist（疑似Gemini 3.0 Flash），在LMArena上提前跟全球网友say hi了。

图片：谷歌Gemini 3.0疑似上线LMArena

消息一出，那还得了？网友们纷纷化身“福尔摩斯”，冲进竞技场一顿猛薅，希望能撞上这两个“稀有怪”。从目前扒出来的实测结果来看，Gemini 3.0这次是真的有点东西，甚至可以说有点“凡尔赛”了。

“时间刺客”上线：AI终于不“脸盲”了？

你可能觉得，看个钟表有啥难的？但对AI来说，这简直是个史诗级难题！アナログ钟表不像数字时钟那样直观，它涉及指针长短、指向、分钟间隔、甚至各种稀奇古怪的表盘样式，这些都是AI多模态理解的**“硬骨头”**。此前，无数AI都曾在这个问题上“翻车”，上演一出出“AI发癫”的大戏。

然而，Gemini 3.0 Pro（就是那个lithiumflow）这次却给所有人上了一课。在LMArena的实测中，它竟然精确无误地识别出了钟表显示的时间：6点02分30秒！

“AI第一次看懂钟表，简直是历史性一刻啊！”（网友@synthwavedd如是说）¹

同样的问题，友商家的GPT-5 Thinking直接“发癫”，把时间误读成12:30，时针分针傻傻分不清楚。连自家的Gemini 2.5 Pro也跟着“发疯”，识别结果一言难尽。这波对比，Gemini 3.0 Pro直接完成了对前辈们的**“降维打击”**，可以说是AI界的“时间刺客”本人了。

“鹈鹕梗”又来了！SVG绘画，是进步还是“卷”过了头？

大模型新版本上线，SVG测试这道“传统艺能题”是绝对躲不过的。SVG，全称可缩放矢量图形，它能让AI画出的图像无论放大多少倍都不会失真，这可是检验AI视觉理解和生成能力的重要指标。

这次Gemini 3.0 Pro在SVG测试上的表现，初看确实可圈可点。它生成的画面表现力比之前测试的模型提升了不止一个档次，甚至带着点**“抽象派艺术家”**的风格，让网友直呼“有内味儿了”。

当然，最经典的那个**“骑自行车的鹈鹕”meme也必须安排上。Gemini 3.0这次把自行车画得是真不错，鹈鹕也栩栩如生。不过，一个值得玩味的现象是：这个“骑自行车的鹈鹕”梗，似乎已经成了各家AI模型心照不宣的“考点”。为了在这道题上拿高分，不少模型可能都悄悄进行了“微调”**。所以，当其他竞技场里的模型都能“完美”画出鹈鹕骑自行车的画面时，反而让Gemini 3.0那带点“抽象”的风格显得有些“不那么完美”了。这究竟是AI在“卷”出新高度，还是在逐渐丧失自己独特的“个性”呢？值得我们思考。

会作曲的AI：文艺青年们，饭碗要保不住了吗？

除了“看表”和“画画”，Gemini 3.0 Pro还悄悄解锁了一项新技能——作曲！这货竟然能模仿多种音乐风格，长时间保持节奏，甚至还能自己玩出点活力和变奏。

有网友评价，这是“第一个相当体面的作曲模型”。

想象一下，你随便哼几句，AI就能给你即兴创作一首完整的曲子，那岂不是要让一众“打工人”音乐家们开始“emo”了？虽然目前大部分实测音乐效果还在初期阶段，但AI在艺术创作领域的步子迈得越来越大，已经是不争的事实。未来，AI能否成为真正的“作曲大师”，我们拭目以待。

“马甲”身份大揭秘：为什么是它俩？

这些“马甲”是怎么被扒出来的？又是怎么确定它们就是Gemini 3.0呢？这就不得不提到AI圈的“侦探网友”们了。有细心网友发现，“Orion”本身就可能与Gemini 3.0存在关联，再加上“orionmist”这种由两个单词合成的命名方式，恰好是谷歌AI团队惯用的“隐藏身份”套路²。

而且，在LMArena上线之前，关于Gemini 3.0的各种内测案例就已经在开发者社区里“满天飞”了。比如，有人爆料它能用一个HTML文件模拟出完整的MacOS或Windows系统UI交互，甚至只用1分钟就能用SVG生成一段风格动画。这些“神仙操作”，都预示着Gemini 3.0绝非等闲之辈。

谷歌的“逆袭”之路：LMArena只是序章？

谷歌的Gemini 2.5发布至今也快一年了，在OpenAI接连打出GPT-5和Sora 2这两张“王炸”后，谷歌似乎只跟了一张“Veo 3.1”。这让外界对谷歌大模型的进展颇为关注。而这次Gemini 3.0“马甲”在LMArena的出现，无疑是谷歌正式发布前的“试水”和“预热”。

根据此前网友的爆料，谷歌下一代旗舰模型Gemini 3.0很可能在10月22日正式发布。这波LMArena的实测，无疑是为正式发布造势，也让大家对谷歌这次能否“硬气一把”，不再“跟着OpenAI跑”，充满了期待。

从多模态AI的视角来看，Gemini 3.0确实展现出了强大的整合能力，它不仅能处理文本、图像、音频，未来甚至可能覆盖视频处理，实现更自然的人机交互体验³。目前，LMArena榜单上腾讯混元图像3.0模型表现抢眼⁴，可见AI大模型领域的竞争已经进入白热化阶段。

总的来说，虽然Gemini 3.0确实在看表、画SVG、作曲这些方面进步神速，但整个AI圈的“传统艺能”也越来越固定了——先传风声、再上LMArena、然后一堆人去撞马甲、测SVG、看谁更像真货。看多了，也确实有点“腻”了。毕竟，无论是Gemini 3.0、GPT-5还是Claude新版本，最后都还是那一套“实测截图+prompt对比+看图说话”。模型越来越聪明，但我们的评测方式似乎还停在“老套路”上。

希望下一次，不只是模型更强，而是真的能玩出点新花样，别让这波AI热潮变成无止境的**“内卷”**。

引用

X.com/@synthwavedd·synthwavedd（2025/10/20）·检索日期2025/10/20 ↩︎
谷歌AI Gemini 3.0，下一代人工智能的突破与未来展望·谷歌Gemini官网（2025/10/20）·检索日期2025/10/20 ↩︎
谷歌ai gemini3.0_谷歌Gemini官网·谷歌Gemini官网（2025/10/20）·检索日期2025/10/20 ↩︎
腾讯混元图像3.0登顶LMArena榜首 - 中关村在线·中关村在线（2025/10/20）·检索日期2025/10/20 ↩︎