GPT-5 Pro杀疯了!Karpathy吹爆:10分钟K.O. Claude一小时,奥特曼狂点赞,谁不用谁亏?

温故智新AIGC实验室

TL;DR:

最近科技圈又炸锅了,AI大佬Karpathy亲测并力赞OpenAI的GPT-5 Pro,表示它在编码难题上只用10分钟就搞定了Claude Code一小时都没辙的“硬骨头”!奥特曼火速回应,这波AI编码的“军备竞赛”,GPT-5 Pro妥妥地“上大分”了,程序员们,你们的“摸鱼神器”升级啦!

最近,科技圈的“摸鱼带师”和“代码搬运工”们突然不淡定了。不是哪个新手机又开始“玩饥饿营销”,也不是哪个游戏大厂又“放鸽子”,而是因为OpenAI家的“新晋顶流”——GPT-5 Pro在编码界“杀疯了”!这波操作,直接让AI大佬Andrej Karpathy都忍不住发文狂吹,连OpenAI的CEO萨姆·奥特曼(Sam Altman)和总裁格雷格·布洛克曼(Greg Brockman)都亲自下场“点赞”带货,这波牌面,简直拉满!

编码擂台赛:GPT-5 Pro VS 众AI,谁是真“卷王”?

故事是这样的:AI圈的“扫地僧”Karpathy大佬,最近遇到一个工作流里的“烫手山芋”,用他的“老伙计”Claude Code折腾了一个小时,愣是没搞定。这可咋办?急中生智,他决定换个“新武器”——GPT-5 Pro试试。没想到,这玩意儿仅用了十分钟,就直接给出了一个“开箱即用”的完美解决方案!1

Karpathy内心OS估计是:“这……简直是魔法吧?”更骚的操作来了,他把GPT-5 Pro的解法拿给Claude看,结果Claude竟然“写了两段小作文”疯狂夸赞GPT-5 Pro的方案。这波“AI互吹”,直接把围观的“吃瓜群众”都整懵了:

“AI模型互相赞赏彼此的工作成果,这才是未来感拉满的巅峰时刻!”1

Karpathy也对此深表认同,他还透露了他一个“超强评估方法”:让所有模型都生成一段内容,然后把结果混在一起,再让每个模型去给所有内容输出排名。一开始大家担心AI会“护犊子”,偏向自己的生成结果,但在Karpathy有限的测试中,事实并非如此。这简直是“生成-判别差距”的现实版演示——写好内容很难,但识别优秀的东西容易多了,模型在这方面做得确实不错。

面对如此炸裂的表现,Karpathy直接放话:“谁要是不把最刁钻的问题交给GPT-5 Pro,简直亏大了!” 这话一出,瞬间引爆了社交媒体。OpenAI CEO奥特曼也迅速赶到“现场”,不仅秒回感谢,还带着一丝“凡尔赛”地好奇问道:“你是更希望它变得更聪明,还是跑得更快?”2 这不就是妥妥地“我全都要”的节奏吗?OpenAI总裁Greg Brockman更是直接盖章:“GPT-5 Pro就是编码的下一代产品。”

其实,在编码领域,各路大神都有自己心水的模型。有人爱Claude,有人站Gemini,还有人钟情于GPT-5/Codex,甚至Grok Code也有一批拥趸。Karpathy自己也坦言,大概三周前,他还觉得Codex在基准编辑和整体体验上不如Claude Code好用。但现在,GPT-5 Pro一骑绝尘,直接“甩别的模型好几条街”!这波“真香定律”,来得可太快了。

除了Karpathy,还有其他开发者也纷纷晒出GPT-5 Pro的“战绩”:

  • 一位开发者在大约6分钟内,一次性完成了应用开发,还能自由组合图像、文本、箭头等元素。这效率,简直是“火箭”级别的!
  • 多轮交流后,GPT-5 Pro还能将SMILES(一种化学结构简化表示法)转换为ASCII代码。这不仅是跨领域的硬核能力,更是AI理解力的体现。

HubSpot联创也对GPT-5 Pro的实力表示认可,虽然他认为OpenAI Codex的用户体验之前不如Claude Code友好,但差距正在急速缩小。这说明,OpenAI不只是在模型能力上“卷”,在用户体验上也铆足了劲。

OpenAI的“大招”:Codex使用量暴增,GPT-5 Pro注入“洪荒之力”

这波“Coding神器”的狂潮,背后离不开OpenAI的精心布局。今年5月,OpenAI正式推出了AI编程智能体Codex,它最初基于o3打造的codex-1模型。而自GPT-5发布并融入最新模型后,Codex的性能如同被注入了“洪荒之力”,一夜之间“能力暴涨”,迅速吸引了大量开发者涌入。

奥特曼在两天前就已经“官宣”了这个惊人数据:过去两周,Codex的使用量竟然暴增了大约10倍!3 这可不是小打小闹,这是实打实的“指数级增长”啊。奥特曼还神秘兮兮地表示,OpenAI内部还有一个“非常高效的模型”,能够提供“大量的使用量”。这操作,有点像游戏里藏着一个“隐藏大招”,让人充满期待。

在PR(Pull Request)竞技场中,Codex的实力更是有目共睹,大幅超越了Devin、GitHub Copilot和Cursor Agent等一众“老牌劲旅”。想象一下,不用一行代码,就能打造一个应用,这种“魔法”般的体验,对于开发者来说,无疑是降维打击式的效率提升。

一位资深的Claude Code开发者,在亲身尝试Codex 48小时后,也对两者进行了详细点评。他同样认为,Codex在处理Claude遇到的棘手问题以及编写代码方面表现良好。看来,GPT-5 Pro的加持,让Codex完成了从“优秀生”到“学霸”的华丽转身。

这波AI“军备竞赛”,我们的代码还好吗?

从Karpathy的“吹爆”到Codex使用量“坐火箭”,我们看到的不仅仅是一个AI模型的进步,更是整个软件开发生态的剧烈变革。曾经,程序员们面对复杂需求,需要“爆肝”熬夜,一行一行地敲代码,调试bug。现在,AI助手不仅能理解自然语言,还能快速生成高质量代码,甚至主动提出解决方案。

这无疑是给程序员们加了一层“外挂”。未来,我们可能不再是纯粹的“代码打工人”,而是更偏向于“AI代码架构师”或“AI项目经理”,把更多精力放在更高层次的逻辑设计和创新上,让AI去处理那些重复性、繁琐的编码工作。

当然,也有人会担心,AI这么强,那我们程序员是不是要“失业”了?这个问题,就像当年计算器出现时人们担心数学家失业一样。AI更像是一个强大的工具,它能极大地提升我们的生产力,让我们从繁重的劳动中解放出来,去探索更多可能性。毕竟,AI再聪明,也得有“人类爸爸”指引方向,不是吗?

这波AI“军备竞赛”还在持续,GPT-5 Pro的异军突起,无疑给这场比赛又添了一把火。是继续“卷”下去,还是巧妙利用AI“躺赢”,或许是每个开发者都在思考的问题。但有一点可以肯定,拥抱变化,永远是科技圈的“生存法则”。

引用


  1. Karpathy · X (2025/9/8) · 检索日期2025/9/8 ↩︎ ↩︎

  2. Sam Altman · X (2025/9/8) · 检索日期2025/9/8 ↩︎

  3. 谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时 · 新浪科技 (2025/9/6) · 检索日期2025/9/8 ↩︎