谷歌Gemini 3.1深夜“掀桌子”:1/4价格跑出5倍速度,这性价比让友商怎么玩?

温故智新AIGC实验室

TL;DR:

谷歌又在深夜偷偷“加餐”,祭出了Gemini 3.1 Flash-Lite,主打一个“快到飞起、便宜到哭”。它直接把GPT-5 mini和Claude 4.5 Haiku按在地上摩擦,正式宣告:AI性价比大战,谷歌要当那个“卷王之王”。

继Gemini 3.1 Pro屠榜封神之后,谷歌似乎觉得给友商的压力还不够大,于是在深夜又扔出一颗重磅炸弹:Gemini 3.1 Flash-Lite正式上线! 1

如果你觉得AI模型现在的速度已经够快了,那Flash-Lite可能会刷新你的认知。每秒输出363个token,这是什么概念?相当于你还没看完这句话,它已经把整篇小作文写完了。更离谱的是,它的价格只有竞争对手的四分之一,这操作简直就是科技界的“蜜雪冰城”,主打一个让同行无路可走。

钞能力大PK:跑得比你快,还比你便宜

AI圈的“贵族选手”们最近可能要集体失眠了。让我们看一组足以让CFO们起立鼓掌的数据:

Gemini 3.1 Flash-Lite的输出速度达到了惊人的363 tokens/s。作为对比,号称轻量级标杆的GPT-5 mini只有71 tokens/s,而Claude 4.5 Haiku也才108 tokens/s。1 也就是说,Flash-Lite的速度是GPT-5 mini的5倍还要多。

在定价上,谷歌更是开启了“自杀式”竞争模式:

  • Gemini 3.1 Flash-Lite:输出1.50美元/百万Token
  • GPT-5 mini:2.00美元/百万Token
  • Claude 4.5 Haiku:5.00美元/百万Token(贵了整整3倍!)

“跑得比你快,还比你便宜,跑分还比你高。” 这种“既要又要还要”的既视感,大概就是谷歌现在的真实写照。

跑分也“越级”:小身材里藏着大智慧

如果只是便宜和快,那只能叫“廉价劳动力”,但Flash-Lite偏偏还要在智商上碾压对手。在最考验科学推理能力的GPQA Diamond测试中,Flash-Lite直接轰出了86.9%的高分,不仅把GPT-5 mini(82.3%)甩在身后,连自家的“前任”2.5 Flash也被踩在了脚下。1 2

最让人直呼“不科学”的是事实准确性。在SimpleQA Verified测试中,Flash-Lite以43.3%的准确率遥遥领先。大家可能对这个数字没概念,对比一下:GPT-5 mini仅有9.5%,而Claude 4.5 Haiku更是低到了5.5%。1 这种断崖式的差距,让那些经常“一本正经胡说八道”的模型显得格外尴尬。

当然,Flash-Lite也不是全能战神。在代码生成(LiveCodeBench)方面,GPT-5 mini依然稳坐钓鱼台,以80.4%的得分领先于Flash-Lite的72.0%。1 看来,想让这个“性价比之王”帮你写复杂的底层逻辑,可能还得再给它一点时间进化。

脑洞大开的功能:思考深度竟然也能“手动调优”?

除了硬核性能,Flash-Lite还标配了一个非常有意思的功能:Thinking Levels(思考等级)

这就像是给AI装了一个变速箱:

  • 如果是批量翻译、垃圾邮件审核这种体力活,直接切换到“浅思考模式”,速度起飞,成本压到地心;
  • 如果是要生成UI界面或者执行多步骤任务,那就切到“深度推理模式”,效果直逼旗舰大模型。

在实际演示中,Flash-Lite展现了极强的多模态能力。给它一句指令,它能在几秒内填满一整个电商平台的原型图,包含上百款商品的名称和价格。1 3 这种“瞬时输出”的能力,对于需要实时响应的AI智能体(AI Agent)来说,简直是梦寐以求的底层基座。

总结:性价比赛道彻底“变天”

过去一年,大模型们都在卷“谁更有文化”,疯狂刷ARC-AGI和代码竞赛的榜单。但Gemini 3.1 Flash-Lite的出现,把战场硬生生地拉到了**“商业化落地”**的维度。4

正如Google DeepMind技术长Koray Kavukcuoglu所言,Flash-Lite是在确保性能的同时,极大地降低了使用成本。2 5 在Chatbot Arena盲测中,这个定价0.25美元(输入)的小模型,Elo分数居然和OpenAI的旗舰推理模型o3打平了。1

对于开发者来说,谁最强固然重要,但谁能用最低的成本把活儿干好,才是真正的“YYDS”。谷歌这次深夜掀桌,不仅是给对手压力,更是给全球开发者发了一波巨大的红包。接下来的球,就看OpenAI和Anthropic怎么接了。

引用


  1. 谷歌Gemini 3.1新模型深夜掀桌,每秒狂飙363 token,1/4价格暴击Claude · 36氪 · 新智元 (2026/03/04) · 检索日期2026/3/4 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Gemini 3.1 Flash-Lite Model Evaluation Report · Google DeepMind · Google (2026/03/04) · 检索日期2026/3/4 ↩︎ ↩︎

  3. Gemini Models: Gemini 3.1 Flash-Lite · Google Blog · Google (2026/03/04) · 检索日期2026/3/4 ↩︎

  4. Gemini Developer API 价格 · Google AI Studio · Google (2026/03/04) · 检索日期2026/3/4 ↩︎

  5. 低成本AI 模型比較:Google Gemini Flash-Lite vs. OpenAI vs ... · LINE TODAY (2026/03/04) · 检索日期2026/3/4 ↩︎