GPT-5.2杀疯了？价格贵400倍，却能KO七成人类专家，打工人瑟瑟发抖！

TL;DR：

OpenAI新晋“卷王”GPT-5.2带着400倍的高价闪亮登场，号称能把七成人类专家都“卷”趴下，简直是打工人的超级外挂！不过，颜值方面它可能有点“直男癌”，面对Google Gemini 3 Pro的时髦配色，GPT-5.2还停留在“毛坯房”时代。

要说最近AI圈最“会玩”的，还得是OpenAI。这不，GPT-5.2横空出世，刚一露面就甩出王炸——价格比DeepSeek贵了足足400倍，比谷歌的Gemini 3 Pro也高了将近10倍¹。这波操作，是想钱想疯了，还是真有两把刷子？

### “专家收割机”上线？GDPval测试告诉你真相

别看价格贵得离谱，OpenAI这次可是冲着“人类专家”来的。官方文档明确表示，GPT-5.2是“迄今为止拥有最强专业知识的通用模型系列”²。它或许真的能开启AI从人类助手到“专家”的进化之路。

为了证明这一点，OpenAI搞了个大动作：推出了一个全新的测试方式——GDPval。这可不是什么野榜，而是OpenAI在今年的“925”（可能是指9月25日发布的标准）提出的，专门用来衡量AI在真实工作环境中，能不能真的帮打工人“干活”¹³。

他们请来了9个领域、44个行业的专家，结合实际工作场景出了“一堆题目”，然后让GPT-5.2去挑战。结果呢？惊不惊喜，意不意外？ 最新的GPT-5.2能在七成的工作上，打平，甚至做得比人类专家更好！¹³ 想象一下，你正在屏幕前摸鱼刷视频，结果AI悄咪咪把你工作给干了，而且还干得更漂亮，这画面是不是有点刺激？

我们自己也小小地体验了一把。让GPT-5.2去互联网上搜集AI公司的模型发布数据，统计分数，然后按月制表。结果在长达14分钟的“深度思考”后，这家伙真的把数据收集、结果统计、表格绘制一整套流程都给搞定了。那完成度，确实看着挺像那么回事儿的¹。据说，它还能完成复杂的表格工作，做得比以前更美观，任务测试指标提升了9%左右。看来，**“打工人神器”**的名号，GPT-5.2是打算坐实了。

### 跑分“卷王”？但“颜值”好像欠费了

当然，光吹自己强，那不是OpenAI的风格。在跑分上，GPT-5.2在各个维度上都比Gemini 3 Pro“高了一点点”¹。不过，RSS原文也补了一句**“不排除OpenAI是对着Gemini刷分的可能”，这句调侃真是把科技圈的“相爱相杀”**展现得淋漓尽致。

但是，金无足赤，AI也一样。在某些方面，GPT-5.2似乎被Google家的**“时尚弄潮儿”Gemini 3 Pro给“暴打”**了。

比如在写代码这块，GPT-5.2的幻觉（就是AI“胡说八道”的概率）降低了38%¹，这让大家可以**“用得更放心了”。它也能写出功能齐全的小游戏，像Aimlab（练习瞄准的小游戏），能跑，还能调整参数。但问题是，它就是有点“太中规中矩了”。同样一句话让AI做小游戏，Gemini 3 Pro已经开始考虑各种时髦配色和UI设计了，而GPT-5.2还在“刷大白墙，做毛坯房”¹。这审美，简直是程序员中的“直男”典范**。

更让人“意难平”的是图像识别。官方展示的案例中，Gemini 3 Pro的颗粒度直接**“爆杀”GPT-5.2¹。看来，在“看图说话”和“艺术细胞”**这块，OpenAI还得再努努力。

### “长记性”又“会听人话”，这AI是来拯救社畜的吗？

除了工作能力的提升，GPT-5.2还有两个**“暖心”**变化，对打工人、科研狗来说，简直是福音：

更懂人话了： 有人测试发现，你让它写50个创意，它就真的认认真真写50个，不像过去的模型，写10个就**“开始摆烂”**¹。这说明GPT-5.2对人类指令的理解和执行力大大增强，告别了“听君一席话，如听一席屁”的尴尬。
上下文能力逆天： 在“插针实验”中，即使文本长度达到256K（相当于几十万字的名著），成功率依然接近百分之百¹²。这意味着什么？就好像你在一部几十万字的小说里，偷偷在几个地方加了点“黑料”，骂了它几句，它都能精准地给你揪出来！这对于写长代码、搞学术研究、总结整理复杂文书的我们来说，简直是**“降维打击”**般的存在。

当然，也有老用户开始吐槽：新模型一发，老版本估计又要**“降智”了，这简直是AI圈的“经典老番”**，懂的都懂。

### AGI殊途同归？大厂们的“偏科”之路

GPT-5.2的发布，也让我们看到了未来AI领域的一个大趋势：顶级模型之间的差异化会越来越明显，大家都在**“偏科”**，各有所长¹。

Google的Gemini：可能在全模态领域一骑绝尘，毕竟它觉得“多模态能感知世界才是未来”¹。
OpenAI的GPT：继续在逻辑推理和生产力方面深耕，信仰极致的效率提升¹³。就像这次的GPT-5.2，直指“经济价值”，成为企业的“核心资产”²。
Anthropic的Claude：则可能在代码能力和高维度语义理解上遥遥领先，认为“对齐”才能通往AGI¹。

反正AI“大哥”位置轮流坐的现状，还在继续。下一回合，按顺序就该Anthropic来出招了。

话说回来，奥特曼（Sam Altman）答应好的**“成人模式”，到底啥时候上啊？这可是不少“老司机”翘首以盼的“彩蛋”**呢！

引用

比DeepSeek贵了400倍，GPT-5.2想钱想疯了？·差评X.PIN·江江 & 早起（2025/12/15）·检索日期2025/12/15 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
一文读懂GPT-5.2 : 直指“经济价值”，硬刚Gemini3的剧情未出现·太平洋电脑网（2025/12/12）·检索日期2025/12/15 ↩︎ ↩︎ ↩︎
GPT-5.2满分屠榜，OpenAI十周年王者归来·知乎专栏（2025/12/12）·检索日期2025/12/15 ↩︎ ↩︎ ↩︎