谷歌Gemini 3.1深夜“掀桌子”：1/4价格跑出5倍速度，这性价比让友商怎么玩？

TL;DR：

谷歌又在深夜偷偷“加餐”，祭出了Gemini 3.1 Flash-Lite，主打一个“快到飞起、便宜到哭”。它直接把GPT-5 mini和Claude 4.5 Haiku按在地上摩擦，正式宣告：AI性价比大战，谷歌要当那个“卷王之王”。

继Gemini 3.1 Pro屠榜封神之后，谷歌似乎觉得给友商的压力还不够大，于是在深夜又扔出一颗重磅炸弹：Gemini 3.1 Flash-Lite正式上线！ ¹

如果你觉得AI模型现在的速度已经够快了，那Flash-Lite可能会刷新你的认知。每秒输出363个token，这是什么概念？相当于你还没看完这句话，它已经把整篇小作文写完了。更离谱的是，它的价格只有竞争对手的四分之一，这操作简直就是科技界的“蜜雪冰城”，主打一个让同行无路可走。

钞能力大PK：跑得比你快，还比你便宜

AI圈的“贵族选手”们最近可能要集体失眠了。让我们看一组足以让CFO们起立鼓掌的数据：

Gemini 3.1 Flash-Lite的输出速度达到了惊人的363 tokens/s。作为对比，号称轻量级标杆的GPT-5 mini只有71 tokens/s，而Claude 4.5 Haiku也才108 tokens/s。¹ 也就是说，Flash-Lite的速度是GPT-5 mini的5倍还要多。

在定价上，谷歌更是开启了“自杀式”竞争模式：

Gemini 3.1 Flash-Lite：输出1.50美元/百万Token
GPT-5 mini：2.00美元/百万Token
Claude 4.5 Haiku：5.00美元/百万Token（贵了整整3倍！）

“跑得比你快，还比你便宜，跑分还比你高。” 这种“既要又要还要”的既视感，大概就是谷歌现在的真实写照。

跑分也“越级”：小身材里藏着大智慧

如果只是便宜和快，那只能叫“廉价劳动力”，但Flash-Lite偏偏还要在智商上碾压对手。在最考验科学推理能力的GPQA Diamond测试中，Flash-Lite直接轰出了86.9%的高分，不仅把GPT-5 mini（82.3%）甩在身后，连自家的“前任”2.5 Flash也被踩在了脚下。¹ ²

最让人直呼“不科学”的是事实准确性。在SimpleQA Verified测试中，Flash-Lite以43.3%的准确率遥遥领先。大家可能对这个数字没概念，对比一下：GPT-5 mini仅有9.5%，而Claude 4.5 Haiku更是低到了5.5%。¹ 这种断崖式的差距，让那些经常“一本正经胡说八道”的模型显得格外尴尬。

当然，Flash-Lite也不是全能战神。在代码生成（LiveCodeBench）方面，GPT-5 mini依然稳坐钓鱼台，以80.4%的得分领先于Flash-Lite的72.0%。¹ 看来，想让这个“性价比之王”帮你写复杂的底层逻辑，可能还得再给它一点时间进化。

脑洞大开的功能：思考深度竟然也能“手动调优”？

除了硬核性能，Flash-Lite还标配了一个非常有意思的功能：Thinking Levels（思考等级）。

这就像是给AI装了一个变速箱：

如果是批量翻译、垃圾邮件审核这种体力活，直接切换到“浅思考模式”，速度起飞，成本压到地心；
如果是要生成UI界面或者执行多步骤任务，那就切到“深度推理模式”，效果直逼旗舰大模型。

在实际演示中，Flash-Lite展现了极强的多模态能力。给它一句指令，它能在几秒内填满一整个电商平台的原型图，包含上百款商品的名称和价格。¹ ³ 这种“瞬时输出”的能力，对于需要实时响应的AI智能体（AI Agent）来说，简直是梦寐以求的底层基座。

总结：性价比赛道彻底“变天”

过去一年，大模型们都在卷“谁更有文化”，疯狂刷ARC-AGI和代码竞赛的榜单。但Gemini 3.1 Flash-Lite的出现，把战场硬生生地拉到了**“商业化落地”**的维度。⁴

正如Google DeepMind技术长Koray Kavukcuoglu所言，Flash-Lite是在确保性能的同时，极大地降低了使用成本。² ⁵ 在Chatbot Arena盲测中，这个定价0.25美元（输入）的小模型，Elo分数居然和OpenAI的旗舰推理模型o3打平了。¹

对于开发者来说，谁最强固然重要，但谁能用最低的成本把活儿干好，才是真正的“YYDS”。谷歌这次深夜掀桌，不仅是给对手压力，更是给全球开发者发了一波巨大的红包。接下来的球，就看OpenAI和Anthropic怎么接了。

引用

谷歌Gemini 3.1新模型深夜掀桌，每秒狂飙363 token，1/4价格暴击Claude · 36氪 · 新智元 (2026/03/04) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Gemini 3.1 Flash-Lite Model Evaluation Report · Google DeepMind · Google (2026/03/04) · 检索日期2026/3/4 ↩︎ ↩︎
Gemini Models: Gemini 3.1 Flash-Lite · Google Blog · Google (2026/03/04) · 检索日期2026/3/4 ↩︎
Gemini Developer API 价格 · Google AI Studio · Google (2026/03/04) · 检索日期2026/3/4 ↩︎
低成本AI 模型比較：Google Gemini Flash-Lite vs. OpenAI vs ... · LINE TODAY (2026/03/04) · 检索日期2026/3/4 ↩︎