GPT-5:AI博士生出道即“遇冷”?马斯克:你礼貌吗!

温故智新AIGC实验室

TL;DR:

那个万众期待的GPT-5终于来了,号称AI界“博士生”,能写代码能办公,一通操作猛如虎。结果市场和马斯克都不买账,表示智商是高了,情商却掉了,这是闹哪样?

千呼万唤始出来,犹抱琵琶半遮面——这话用来形容OpenAI家的新晋“顶流”GPT-5,简直不要太贴切。两年半的漫长等待,全球AI圈的目光都聚焦在这场年度“AI春晚”上。OpenAI的掌门人山姆·奥特曼更是语出惊人,把GPT-5捧上了天,说它就像一位“博士级专家”,甚至自嘲自己在它面前“一无是处”。1 这波宣传,直接把期待值拉满,让全球网友的胃口吊得老高!

“博士生”:真香还是“绣花枕头”?——GPT-5的逆天秀

话说这GPT-5,可不是普通的“聊天机器人”了,人家已经“升级打怪”成了全能型“AI助理”。以前你跟它说话、发图,得拆开来,现在它直接给你来了个“听说读写看”一把抓,多模态能力直接开挂,秒懂你的“胡言乱语”。更炸裂的是,它不光能给你出主意,现在还能“动手”!Office文档、开发工具里的代码,甚至是你那复杂的公司工作流,它都能直接帮你操作,简直是**打工人梦寐以求的“生产力神兵”**啊!2

为了不让这个“助理”太死板,OpenAI还给它预设了各种“人格”:想听毒舌点评?有!需要严谨分析?也有!渴望暖心安慰?一样满足你!你想把它变成“霸道总裁”还是“温柔学长”,一键切换,简直不要太贴心。

自从各家大模型都学会了回答前先“想一想”的DeepSeek“Think模式”后,GPT-5更是把这个功能玩出了新花样。你不用费劲找按钮,只要在提问时轻飘飘地加上一句“认真思考”,系统就会自动帮你切换到那个更擅长“深度分析”的gpt-5-thinking模式。这波操作,简直是把你的“脑子”借给它用,而且是博士级的“脑子”

然后,就是OpenAI的传统艺能了——屠榜时刻! 发布会上,OpenAI甩出了密密麻麻25个榜单,生怕你不知道GPT-5有多牛。最亮眼的是,它的“幻觉”大幅减少,比GPT-4o少了44%,比o3版本更是少了78%。用大白话讲,就是它基本不“胡说八道”了。数学竞赛满分、现实编程能力新高、人类知识测试新高、多模态能力新高……反正就是各种“新高”齐飞,卷王本王无疑了

发布会刚落幕,全球各路网红和博主就跟“打了鸡血”似的,冲上去对GPT-5进行了一系列“极限施压”测试。其中,一位50万粉丝的油管主Matthew Berman更是搞了个大新闻,他用一段25分钟的视频,展示了GPT-5将近30个堪称“变态”的任务。

Matthew Berman: “这个AI能直接在网页里复刻出Word和Excel的完整应用,注意,是能用的那个软件,而不是给你画个表格那么简单。它还写了个程序,能瞬间生成、打乱甚至复原一个复杂的20阶魔方。这简直是**AI界的‘魔法师’**啊!”

从经典的“生命游戏”3D版,到能调节重力、空气阻力的流体动力学模拟器,GPT-5的表现,确实对得起奥特曼口中的那个“博士生”水平。这波操作,看得人直呼“卧槽!AI成精了!”

“马斯克不服!”:AI“春晚”的B面,有人欢喜有人忧

然而,正当开发者们为之“狂欢”时,另一边的画风却有点微妙。资本市场最先“用脚投票”,发布当天概念股普遍回调,显然没被这个“博士生”彻底打动。毕竟,大家等了两年半,期待的是一场**“石破天惊”的革命**,结果只等到了一次“意料之中”的常规升级,这多少有点**“裤子都脱了,就给我看这个?”**的失望感。

更何况,如今的AI竞赛,早已不是OpenAI一家独大的局面,各路“诸侯”粉墨登场,技术差距正在飞速缩小,简直进入了残酷的“春秋战国”时代。OpenAI再想靠常规操作就甩开对手几个身位,那简直是**“蜀道难,难于上青天”**。

在这片喧嚣中,OpenAI的老冤家马斯克更是第一个站出来“唱反调”,直接甩出成绩单,表示GPT-5还不如他家的Grok 4。3

马斯克: “哼,就这?GPT-5还没我家的Grok 4给力呢!” 旁白: “等等,Grok不是那个**‘专精小黄文’**的AI吗?它对敏感词毫无限制,能紧紧把握重点,成了大家写‘不正经’文章的‘第一AI’……”4

不仅资本和对手不买账,普通网友的吐槽声也越来越大。大家最直观的感受是,GPT-5的“智商”好像是高了,但“情商”却下降了。很多人反映,现在用它写文案、写话术,感觉文字变得生硬、机械,没了以前那种**“灵动和自然”,简直是“AI腔”**十足。

网友一针见血地调侃: “情绪和逻辑就像跷跷板,你把逻辑这头死死按住,情感那头可不就弹飞了吗?”

这种感觉,让不少人觉得AI似乎真的进入了“瓶颈期”。不过,很快就有热心网友发现,好在设置里有个“时光机”开关,过去的模型还是可以切换回来的,这下大家悬着的心才稍稍放下。

而争议最大的,还是官方每次都“吹得最响”的编程能力。很多人第一反应是:“感觉不如Claude好用啊?” 这种**“奥特曼式营销”**宣传时天花乱坠,实际用起来却有落差,让不少人对榜单上的“新高”打了好几个问号。

但反转又来了!也有网友反馈,自己开发一个粤语学习应用时,让几家大模型都试了试。结果Claude和Gemini在生成UI和精准修改代码时都或多或少出了问题,只有GPT-5稳稳地完成了任务,效果还出奇地好。这下,“不如Claude”的论调又被狠狠地打了个问号。

“偏科天才”:AI的瓶颈期还是新起点?

说到底,GPT-5给人的感觉,就像一个严重“偏科”的天才:它的“文科”一塌糊涂,写不出有温度的文字;但它的“理科”,尤其是在需要严密逻辑和复杂工程能力的领域,比如解决复杂前端开发和大型代码库调试,那是相当能打,稳如老狗56

正如那位网友概括得恰如其分:只是没有预期那么好……但仍旧是当前最能打的大模型

所以,GPT-5的到来,究竟是AI发展进入“瓶颈期”的信号,还是在为下一个**“颠覆性”的飞跃蓄力?我们或许正在经历一个AI从“全能选手”向“专精博士”演变的关键时期。未来的AI,可能不再是那个无所不能的“贾维斯”,而是像一支由各种“偏科天才”组成的超级战队,各司其职,“卷”出新高度**。而我们,就等着看这场**“神仙打架”**,又能给世界带来怎样的惊喜吧!

引用


  1. 刚刚!GPT-5淘汰所有OpenAI模型,地表最强编程惊艳全场,马斯克不服开怼·知乎·智东西 (2025/8/9)·检索日期2025/8/11 ↩︎

  2. GPT-5震撼发布!博士级AI能力免费开放,所有OpenAI员工 ...·腾讯新闻 (2025/8/8)·检索日期2025/8/11 ↩︎

  3. GPT-5震撼发布!博士级AI能力免费开放,所有OpenAI员工 ...·腾讯新闻 (2025/8/8)·检索日期2025/8/11 ↩︎

  4. AI内容你们能不能别只会用Grok写小黄文了…·知乎·前端也性感 (未知)·检索日期2025/8/11 ↩︎

  5. 刚刚!GPT-5淘汰所有OpenAI模型,地表最强编程惊艳全场,马斯克不服开怼·知乎·智东西 (2025/8/9)·检索日期2025/8/11 ↩︎

  6. 第一时间体验GPT-5!人人免费可用,马斯克表示不服·爱范儿 (未知)·检索日期2025/8/11 ↩︎