谷歌Gemini 3.1 Pro深夜偷袭:手搓Win11、复刻《模拟城市》,这波操作让GPT-5也汗流浃背了?

温故智新AIGC实验室

TL;DR:

谷歌发了个“.1”的小版本更新,结果威力堪比原子弹:推理能力直接翻倍,能当场在浏览器里“手搓”Windows 11和《模拟城市》,12项跑分血洗GPT-5.2和Claude 4.6。现在的AI不仅能写文案,甚至打算连程序员和UI设计师的饭碗一起端了!

就在国内大模型还在卷“春节档”的时候,谷歌DeepMind突然深夜放毒,发布了新一代旗舰模型 Gemini 3.1 Pro。虽然版本号只往后挪了“0.1”,但这哥们的战斗力提升简直像是开了挂。1

去年11月Gemini 3 Pro才刚露脸,大家都还在感慨它的多模态理解力,结果谷歌反手就是一个“背刺”。清华物理系传奇人物、谷歌DeepMind成员姚顺宇(Shunyu Yao)都忍不住感慨:“更好的Gemini正以势不可挡的速度涌现。”2 这潜台词大概就是:各位友商,不好意思,我们要加速超车了。

生产力还是“超能力”?它连操作系统都能手搓

如果说以前的AI是“纸上谈兵”,那Gemini 3.1 Pro现在就是“实战工兵”。

最让人目瞪口呆的是它的 “手搓系统” 能力。有博主实测,给它一个指令,它能直接在浏览器里整出一个轻量级的 Windows 11 WebOS1 别以为这只是个贴图,这个系统有完整的开始菜单、应用图标,甚至还有基础的窗口交互逻辑。上个版本做这种事还要费老劲,现在已经成了它的“日常基本操作”。2

不只是操作系统,谷歌UX工程师Michael Chang还用它搞出了个 “模拟城市” App。从复杂地形处理到道路铺设、交通流模拟,Gemini 3.1 Pro一气呵成。3 如果你觉得写代码做3D动画太难,那来看看它的SVG生成能力:

  • 物理常识满分:生成的“鹈鹕骑自行车”不仅车架、链条细节完整,连骑行姿态都符合运动规律。1
  • 代码即正义:这些动画全是纯代码构建的SVG,无限放大不模糊,体积还比视频小得多。

最离谱的还得是它的“脑补”能力。网友丢给它一张乱糟糟的街头垃圾桶照片,它不仅能识别垃圾,还能像侦探一样指出:如果你眯着眼看,这些垃圾阴影其实拼成了两个并排坐的卡通角色。1 这种视觉推理能力,确实让只会看图说话的普通模型汗流浃背。

行业“地震”:谁在屠榜,谁在陪跑?

跑分数据虽然枯燥,但最能说明谁是真正的“卷王”。在业界公认高难度的 ARC-AGI-2 通用智能基准测试中,Gemini 3.1 Pro拿下了 77.1% 的高分,直接比上一代翻了一倍多。3

“在这个追求‘智能极限’的考场上,Gemini 3.1 Pro在12项测试中拿下了第一,把Claude Opus 4.6和GPT-5.2都甩在了身后。”1

虽然在一些高阶工程能力的SWE-Bench测试中略逊于Claude Sonnet 4.6,但在多模态理解、长文本处理和日常“脑筋急转弯”上,它几乎是统治级的。比如“父母能否结婚”这种陷阱题,它现在已经能稳稳避坑,不再一本正经地胡说八道了。1

诚意拉满:加量不加价,开发者狂喜

最让开发者心动的是,Gemini 3.1 Pro的API价格居然跟上一代 完全一致2

  • 20万token以内:输入2美元/百万token。
  • 100万上下文:这容量意味着你可以把一整本小说、一小时视频甚至整个代码库丢给它。4

目前,Google AI Pro和Ultra用户已经在NotebookLM里爽上了。免费用户虽然只能每天“白嫖”两次提问机会,但这波更新释放出的信号非常明确:大模型的竞争已经从“谁的参数大”转向了“谁能把活儿干漂亮”。3

谷歌这波“.1”的小版本升级,不仅是技术上的跃迁,更像是在向世界宣告:AI已经从单纯的“聊天机器人”,正式进化为能解决真实世界复杂任务的“全能Agent”。至于压力,现在全在友商那边了。

引用


  1. 谷歌Gemini 3.1 Pro新王登场!一口气手搓Win11操作系统 · 知乎 · 智东西 (2026/2/20) · 检索日期2026/2/20 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 谷歌突发Gemini 3.1 Pro!首次采用「.1」版本号,推理性能×2 · 新浪 · 新浪看点 (2026/2/20) · 检索日期2026/2/20 ↩︎ ↩︎ ↩︎

  3. 编码新王登基!Gemini 3.1 Pro 血洗Claude 与GPT,12 项基准测试 ... · 网易 · 智东西 (2026/2/20) · 检索日期2026/2/20 ↩︎ ↩︎ ↩︎

  4. Gemini 3 Pro | Generative AI on Vertex AI · Google Cloud · Google (2025/11/18) · 检索日期2026/2/20 ↩︎