TL;DR:
OpenAI新晋“卷王”GPT-5.2带着400倍的高价闪亮登场,号称能把七成人类专家都“卷”趴下,简直是打工人的超级外挂!不过,颜值方面它可能有点“直男癌”,面对Google Gemini 3 Pro的时髦配色,GPT-5.2还停留在“毛坯房”时代。
要说最近AI圈最“会玩”的,还得是OpenAI。这不,GPT-5.2横空出世,刚一露面就甩出王炸——价格比DeepSeek贵了足足400倍,比谷歌的Gemini 3 Pro也高了将近10倍1。这波操作,是想钱想疯了,还是真有两把刷子?
### “专家收割机”上线?GDPval测试告诉你真相
别看价格贵得离谱,OpenAI这次可是冲着“人类专家”来的。官方文档明确表示,GPT-5.2是“迄今为止拥有最强专业知识的通用模型系列”2。它或许真的能开启AI从人类助手到“专家”的进化之路。
为了证明这一点,OpenAI搞了个大动作:推出了一个全新的测试方式——GDPval。这可不是什么野榜,而是OpenAI在今年的“925”(可能是指9月25日发布的标准)提出的,专门用来衡量AI在真实工作环境中,能不能真的帮打工人“干活”13。
他们请来了9个领域、44个行业的专家,结合实际工作场景出了“一堆题目”,然后让GPT-5.2去挑战。结果呢?惊不惊喜,意不意外? 最新的GPT-5.2能在七成的工作上,打平,甚至做得比人类专家更好!13 想象一下,你正在屏幕前摸鱼刷视频,结果AI悄咪咪把你工作给干了,而且还干得更漂亮,这画面是不是有点刺激?
我们自己也小小地体验了一把。让GPT-5.2去互联网上搜集AI公司的模型发布数据,统计分数,然后按月制表。结果在长达14分钟的“深度思考”后,这家伙真的把数据收集、结果统计、表格绘制一整套流程都给搞定了。那完成度,确实看着挺像那么回事儿的1。据说,它还能完成复杂的表格工作,做得比以前更美观,任务测试指标提升了9%左右。看来,**“打工人神器”**的名号,GPT-5.2是打算坐实了。
### 跑分“卷王”?但“颜值”好像欠费了
当然,光吹自己强,那不是OpenAI的风格。在跑分上,GPT-5.2在各个维度上都比Gemini 3 Pro“高了一点点”1。不过,RSS原文也补了一句**“不排除OpenAI是对着Gemini刷分的可能”,这句调侃真是把科技圈的“相爱相杀”**展现得淋漓尽致。
但是,金无足赤,AI也一样。在某些方面,GPT-5.2似乎被Google家的**“时尚弄潮儿”Gemini 3 Pro给“暴打”**了。
比如在写代码这块,GPT-5.2的幻觉(就是AI“胡说八道”的概率)降低了38%1,这让大家可以**“用得更放心了”。它也能写出功能齐全的小游戏,像Aimlab(练习瞄准的小游戏),能跑,还能调整参数。但问题是,它就是有点“太中规中矩了”。同样一句话让AI做小游戏,Gemini 3 Pro已经开始考虑各种时髦配色和UI设计了,而GPT-5.2还在“刷大白墙,做毛坯房”1。这审美,简直是程序员中的“直男”典范**。
更让人“意难平”的是图像识别。官方展示的案例中,Gemini 3 Pro的颗粒度直接**“爆杀”GPT-5.21。看来,在“看图说话”和“艺术细胞”**这块,OpenAI还得再努努力。
### “长记性”又“会听人话”,这AI是来拯救社畜的吗?
除了工作能力的提升,GPT-5.2还有两个**“暖心”**变化,对打工人、科研狗来说,简直是福音:
- 更懂人话了: 有人测试发现,你让它写50个创意,它就真的认认真真写50个,不像过去的模型,写10个就**“开始摆烂”**1。这说明GPT-5.2对人类指令的理解和执行力大大增强,告别了“听君一席话,如听一席屁”的尴尬。
- 上下文能力逆天: 在“插针实验”中,即使文本长度达到256K(相当于几十万字的名著),成功率依然接近百分之百12。这意味着什么?就好像你在一部几十万字的小说里,偷偷在几个地方加了点“黑料”,骂了它几句,它都能精准地给你揪出来!这对于写长代码、搞学术研究、总结整理复杂文书的我们来说,简直是**“降维打击”**般的存在。
当然,也有老用户开始吐槽:新模型一发,老版本估计又要**“降智”了,这简直是AI圈的“经典老番”**,懂的都懂。
### AGI殊途同归?大厂们的“偏科”之路
GPT-5.2的发布,也让我们看到了未来AI领域的一个大趋势:顶级模型之间的差异化会越来越明显,大家都在**“偏科”**,各有所长1。
- Google的Gemini:可能在全模态领域一骑绝尘,毕竟它觉得“多模态能感知世界才是未来”1。
- OpenAI的GPT:继续在逻辑推理和生产力方面深耕,信仰极致的效率提升13。就像这次的GPT-5.2,直指“经济价值”,成为企业的“核心资产”2。
- Anthropic的Claude:则可能在代码能力和高维度语义理解上遥遥领先,认为“对齐”才能通往AGI1。
反正AI“大哥”位置轮流坐的现状,还在继续。下一回合,按顺序就该Anthropic来出招了。
话说回来,奥特曼(Sam Altman)答应好的**“成人模式”,到底啥时候上啊?这可是不少“老司机”翘首以盼的“彩蛋”**呢!