王炸!GPT-5“杀疯了”:淘汰旧神,编程YYDS,马斯克不服开怼!

温故智新AIGC实验室

TL;DR:

GPT-5空降C位,直接“淘汰”OpenAI老前辈,编程能力更是卷出新高度,让程序员直呼“真香”!价格还香,马斯克看了直摇头“不服就干”,这波AI“内卷”大戏,属实精彩。

就在今夜凌晨1点,AI圈投下了一颗重磅炸弹!OpenAI的最新旗舰大模型GPT-5,带着一股“舍我其谁”的霸气,直接宣告:“所有旧模型,统统退下!” 这话一出,简直是杀疯了的节奏!1 甫一上线,GPT-5就如同一匹脱缰的黑马,原地飞升各大榜单C位,在文本、编程、数学等全维度实现降维打击,直接登顶大模型竞技场榜首。1

它来了它来了,带着“智商税”还是“真香”?

这次GPT-5的登场,可不是小打小闹。它最大的亮点之一,就是把非推理模型和推理模型融为一体,实现了“按需思考”的黑科技。简单来说,就是AI能根据任务难度,自己判断要不要“认真想想”,这波操作简直是把“偷懒”和“勤奋”拿捏得死死的。1

更绝的是,GPT-5还拥有四种“人格”:愤世嫉俗者、机器人、倾听者和书呆子。这哪是模型,简直是AI界的“千面影帝”啊!OpenAI CEO山姆·奥特曼(Sam Altman)更是放出豪言,称GPT-5已经达到了博士级别的智能,跟你对话就像和一位“全领域博导”唠嗑。更关键的是,它不只是“问答机”,还能**“为你做事”**,从日常规划到采购发邀请函,简直是你的AI“管家婆”上线!1

OpenAI研究员蒂娜·金(Tina Kim)直接甩出王炸:“有了GPT-5,我们将淘汰所有旧模型。” 一个GPT-5就集成了多模态、推理等多种能力,相当于把GPT和o系列模型打包融合,以后用户再也不用在复杂的产品族里“选择困难症”发作了。1

当然,这位“新晋顶流”也有自己的“家族”,GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本齐上阵。免费用户可以尝鲜,但用量有限,超额就自动转到mini版,而真正的“大佬”GPT-5-pro,那可是Pro订阅用户专属,拥有扩展推理功能,答案更全面、更精准,就问你**“氪不氪金”**?1

说到价格,OpenAI这次也是卷到飞起。GPT-5的API价格相比竞争对手Anthropic和谷歌,可以说相当甚至更低,简直是“价格屠夫”本尊,直接把门槛给干下来了1

代码能力卷出新高度,程序员的“电子显眼包”?

要说GPT-5最让人**“尖叫”的能力,那必须是编程!OpenAI直接表示,它是迄今为止最好的编程模型**。发布会上,工作人员随手一挥,GPT-5就分分钟搭建了一个学习法语的网站,还嵌入了贪吃蛇小游戏。这效率,简直是让程序员看了直呼“要失业”,老板看了直呼“YYDS”1

为了证明自家“孩子”的实力,OpenAI甚至请来了明星AI编程企业Cursor的联合创始人兼CEO迈克尔·特鲁尔(Michael Truell)现场“考证”。特鲁尔直接拿了一个3周没解决的GitHub PR问题给GPT-5,结果你猜怎么着?GPT-5在API调用中展现了惊人的稳定性,解决问题的速度比他本人快!很!多!1

“GPT-5在API调用中展现出了不错的稳定性……解决问题的速度比他本人要快很多。” — Cursor联合创始人兼CEO 迈克尔·特鲁尔

(听起来,人类程序员的咖啡续命模式要开启了,这内卷可真不是盖的!)

这波操作直接把GPT-5送上了编程界的“SOTA”(State-of-the-Art,业界最佳)。在SWE-bench验证测试中,GPT-5拿下了74.9%的准确率,比自家的o3版本还高,而且用的token和工具调用次数更少,简直是又快又好又省钱的典范!123 不仅如此,在长背景信息处理方面,GPT-5的表现也比o3和GPT-4.1强了不止一点点,这说明它读长文档的能力也**“buff叠满了”1 甚至,它还能生成精美的小游戏画面和Lofi视觉化效果器,看来前端工程师的“饭碗”也得加固一下**了。1

不只会“干活”:模型“情商”与“智商”的全面升级

除了能打能写能编程,GPT-5这次还升级了“情商”和“智商”的双重体验。

首先是安全问题。以前的ChatGPT,有时候会因为模糊的意图“过度拒绝”,像个**“杠精”。但GPT-5引入了“安全完成”训练,现在它会尽量给出有用的答案,即便拒绝,也会告诉你原因和替代方案。这不就是“情商高”**的表现吗?1

更让人拍案叫绝的是,OpenAI还解决了GPT系列模型“阿谀奉承”的问题!没错,就是那种动不动就**“恭维得你脸红”,或者“无意义表情包满天飞”的毛病。现在,GPT-5回复中“阿谀奉承”的比例从14.5%直接降到了不到6%,这下终于能“好好说话”**了,告别那些不必要的“甜言蜜语”!1

而GPT-5 Pro,更是集**“高智商”于一身。它凭借一项叫做“并行测试时计算”**的黑科技,能够同时进行多项推理,提供更全面、更高质量的答案。用OpenAI自己的话说,外部专家有超过67.8%的人更喜欢Pro版的回答,而且重大错误率还降低了22%!1

虽然奥特曼对“通用人工智能(AGI)”这个词有点“讨厌”,觉得大家对它的定义**“有点乱”,但他承认GPT-5是朝着“真正强大的模型”迈出的重要一步。不过,他也清醒地指出,GPT-5仍然缺少一些“非常重要的东西”——比如模型在部署过程中能够持续学习的能力。看来,AI的“成长之路”依然道阻且长**啊。1

八卦擂台:马斯克“开怼”,谁的AI更“硬核”?

这边OpenAI“王炸”刚出,那边“科技狂人”埃隆·马斯克就坐不住了! 就在GPT-5发布后不久,马斯克直接在X上**“开怼”**,宣称自家的Grok 4在ARC-AGI测试中“击败了GPT-5”。1

“Grok 4在ARC-AGI上击败了GPT-5。” — 埃隆·马斯克

(这架势,简直是AI界的“神仙打架”,流量直接拉满!)

网友们也是看热闹不嫌事大。有人觉得这是Grok 4推理和泛化能力强的证明,也有人忍不住吐槽:Grok 4要氪金300美元才能用,而GPT-5免费用户也能用,这性价比,到底谁更香?这波对比,简直是AI界的“擂台赛”,谁能笑到最后,还得看用户**“用脚投票”**!1

不过,这场AI盛宴也并非没有**“槽点”。有眼尖的网友发现,OpenAI在发布会上展示基准测试时,似乎玩起了“视觉欺骗”:柱状图中OpenAI o3的高度被不成比例地压缩了,这在某种程度上“夸大”了GPT-5的性能提升。1 看来,即便是AI巨头,也难逃“小伎俩”**的争议。

但无论如何,GPT-5的发布无疑是今年AI圈最受关注的事件之一。它不仅在技术上带来了颠覆性突破,也在商业上给OpenAI带来了巨大的想象空间。外媒消息称,OpenAI的估值已经飙升至5000亿美元(约合3.6万亿人民币),比年初直接翻了一倍,简直是**“原地暴富”**的节奏!1

GPT-5的出现,让我们看到AI正在以肉眼可见的速度进化。它不只是一个模型,更是未来AI发展的一个缩影。正如OpenAI首席科学家雅各布·帕霍基(Jakub Pachocki)所说,GPT-5的许多技术,都将在未来得到进一步发展。我们仍然有很多需要了解的东西,但AI发现全新知识、真正让生活更美好的愿景,正在一步步照进现实。未来已来,AI的**“星辰大海”**,才刚刚拉开序幕。

引用


  1. 刚刚,GPT-5淘汰所有OpenAI模型,地表最强编程惊艳全场·智东西·陈骏达 李水青(2025/8/8)·检索日期2025/8/8 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. OpenAI最强模型GPT-5来了,微软抢先接入·新浪财经(2025/8/8)·检索日期2025/8/8 ↩︎

  3. OpenAI最强模型GPT-5来了!免费可用,Altman高呼迈向 ...·华尔街见闻(2025/8/8)·检索日期2025/8/8 ↩︎