GPT-5:AI界新王登基?等等,数学题它咋还算不对呢?!

温故智新AIGC实验室

TL;DR:

千呼万唤始出来的OpenAI GPT-5,带着编程“王炸”和“价格屠夫”的称号闪亮登场,号称幻觉率狂降,上下文理解更“懂你”。但!它在一次简单的数学题上却“翻车”了,让一众吃瓜群众直呼:这AI是不是也“偏科”啊?


最近AI圈简直是“炸锅”了,各路科技媒体头条被OpenAI的新宠——GPT-5——刷屏。本以为这将是AI界的又一次“史诗级”登场,结果呢?根据小道消息(和一些心急如焚的网友实测),这场“大秀”似乎没那么“丝滑”。1 尤其是那道连小学生都能“秒杀”的算术题,竟然把堂堂GPT-5给“CPU”坏了,你说气不气人?

啥?AI界的“学霸”竟然在小学数学上“翻车”了?

咱先不聊那些高大上的参数、架构,就说这“翻车现场”吧。想象一下,一个号称集万千宠爱于一身的AI“顶流”,面对这样一道送分题:5.9 = x + 5.11。它,竟然,卡壳了,甚至可能给出了一个让你怀疑人生的答案!1 网友们纷纷表示,这简直是“迷惑行为大赏”,难不成GPT-5也和我们普通打工人一样,面对数字就犯晕?

“这届AI不行啊,连小学算术题都搞不定,是不是摸鱼太多了?” —— 某网友激情吐槽,大概是算术考试刚及格。

咳咳,玩笑归玩笑。这事儿听起来确实有点“出戏”,毕竟我们对这类模型的期望值已经拉满了。但话说回来,大模型在计算上的“小马失蹄”并非首次,这背后隐藏的,其实是大型语言模型(LLM)与传统计算器逻辑之间的一些深层差异。它们更擅长理解和生成自然语言,而不是精确的数学推理,尽管OpenAI一直在努力弥补这一短板。

GPT-5到底“牛”在哪儿?别急着下定论!

虽然有小插曲,但GPT-5的实力依然不容小觑。别看它在小学数学上“翻了船”,但在其他领域,这货简直是“开了挂”!

  • 编程能力,简直是“码农狂喜”! GPT-5在编程方面的表现可以用“惊艳”来形容,它能显著提升码农们的效率,让“写代码”这事儿变得更像“搭积木”。想象一下,你的AI助手能分分钟帮你搞定那些让你抓耳挠腮的Bug,是不是瞬间感觉人生充满了希望?2
  • “价格屠夫”驾到,同行要哭了? 这次OpenAI也是下血本了,GPT-5的API价格低得吓人,据说只是友商Claude Opus 4.1的零头,比Gemini 2.5 Pro还要便宜。这简直是给开发者们发了个“大红包”,估计友商们都在连夜开会,琢磨着怎么“卷”回来了。2
  • “告别胡说八道”,幻觉率狂降! 困扰大模型用户的“幻觉”问题,这次也得到了大幅缓解。GPT-5出现事实错误的概率比GPT-4o低了约45%,比OpenAI o3更是狂降80%!这意味着你和AI聊天时,它胡编乱造的几率大大降低,沟通成本瞬间down down down。2
  • “AI管家”上线,不再选择困难症! 最有意思的是,GPT-5并非一个单一的模型,它背后藏着一个“路由器”机制。34 就像一个智能管家,能根据你的意图(比如是想聊天、编程还是推理),自动调用最合适的子模型来服务你。这意味着用户不用再纠结是选“语言模式”还是“推理模式”了,AI会帮你搞定一切,简直是“懒人福音”!5

AI江湖风云再起:谁能笑到最后?

GPT-5的发布,无疑再次搅动了AI江湖的一池春水。虽然它在性能提升上可能不像前几代那样“翻天覆地”,仅在部分基准测试中微幅领先竞品,2 但其在编程、成本和幻觉率上的突破,依然是里程碑式的进展。

这背后也隐约透露出一些信号:大模型的“参数 Scaling Law”和“Test-Time Compute (TTC) Scaling Law”似乎都开始出现放缓的迹象。2 这意味着,未来AI的竞争可能不再是单纯地“堆算力、拼参数”,而是更考验模型架构的创新、数据质量的打磨,以及实际应用场景的落地能力。

说到底,GPT-5的这次亮相,既有让人惊叹的“高光时刻”,也有让人摸不着头脑的“小失误”。这或许也正是AI发展现状的真实写照:它正在以惊人的速度进化,但离真正的“完美无瑕”,还有很长一段路要走。我们这些“吃瓜群众”呢,就搬好小板凳,继续围观这场科技巨头们的“神仙打架”吧!

引用


  1. OpenAI’s GPT-5 rollout is not going smoothly·Reddit(2025/8/9)·检索日期2025/8/9 ↩︎ ↩︎

  2. 一文读懂GPT-5发布会|价格屠夫、编程惊艳,新功能乏善可陈·华尔街见闻(2025/08/07)·检索日期2025/8/9 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  3. 如何评价OpenAI 2025 年8 月8 日凌晨发布的GPT-5?·知乎(2025/8/8)·检索日期2025/8/9 ↩︎

  4. GPT-5,重磅来袭!·新浪科技(2025/08/08)·检索日期2025/8/9 ↩︎

  5. GPT-5来了,微软抢先接入:一键生成网页、博士级智能·证券时报(2025/08/08)·检索日期2025/8/9 ↩︎