OpenAI今夜放大招,GPT-5.6携Codex来抢王座,Anthropic“口袋浅”如何接招?

温故智新AIGC实验室

TL;DR:

今晚OpenAI要搞大事,奥特曼亲自直播,GPT-5.6据说本周反杀,性能比5.5猛涨12%-15%,价格还便宜2-3倍。另一边Anthropic刚靠Opus 4.8登顶编程榜,扭头就提交了IPO——这是要边融资边打仗。AGI决赛圈,拼的不只是模型,更是算力、钱和时机。


群雄争霸,AGI桂冠花落谁家?

这周AI圈堪称“神仙打架”连续剧。AGI Ranker最新Coding排行榜上,Claude Opus 4.8刚刚以81.01分坐上王座,把GPT-5.5的77.48分踩在脚下——3.5分的差距,看似不大,但已经是三个月内第三次易主了。

第一次,Claude Opus 4.7登顶,Anthropic弹冠相庆。第二次,GPT-5.5反超,OpenAI扳回一城。第三次,Opus 4.8杀回来,Anthropic重新站上榜首。1

这哪是技术竞赛,简直是“你方唱罢我登场”的擂台赛。而今晚,OpenAI可能要亮出新的底牌了。


今晚直播,奥特曼亲自上阵

明天(美国东部时间上午),OpenAI将举行「Intelligence at Work」直播活动,山姆·奥特曼本人确认出席。随后,微软CEO纳德拉下午会在Microsoft Build大会上发表开幕主题演讲。1

这不是普通的画饼直播。据内部人士透露,OpenAI这次准备了两记重拳——

第一拳:Codex重大更新

Codex团队开发了数月,核心方向是让Codex从“代码补全工具”进化成“编程智能体”。1 简单说,以前Codex是帮你敲代码的“自动补全”,现在它要变成能自己写、自己调试、甚至自己部署的“数字同事”。你给它一个复杂任务,它能自己琢磨几个小时,中途还会主动跟你汇报进度、问你意见——像不像一个会上进但又爱请示的实习生?2

更关键的是,昨天OpenAI刚宣布Codex及前沿模型已在AWS Bedrock上全面可用,并称之为“更广泛扩展的开端”。1 紧接着就是Codex大更新,这节奏,显然不是巧合。

第二拳:GPT-5.6可能本周发布

这才是今晚最大的瓜。据多个信源爆料,GPT-5.6预计本周内发布,性能有望直逼Anthropic的顶级Mythos系列,但价格却便宜2-3倍。3 内部人士甚至说:“GPT-5.6本可以轻松被称为GPT-6。”1

好家伙,名字都省了,直接跳级?

更劲爆的是性能提升数据:GPT-5.6在某些方面的目标是比GPT-5.5提升12%到15%。相比之下,Opus 4.7到4.8的平均提升幅度只有约6.5%。1 这一步幅,相当于在短跑比赛中突然加速,不给人反应时间。

证据链也很有意思:一个引用“gpt-5.6”的rollout-mapping条目短暂出现在OpenAI内部Codex日志中,然后又消失了——典型的“金丝雀测试”手法,也就是小范围探针,用于测试而非发布。14 但结合OpenAI连续发布GPT-5.4、GPT-5.5、GPT-5.5 Instant的节奏,再来一个小版本更新完全合情合理。

Polymarket上交易员认为GPT-5.6在6月30日前发布的概率高达80-89%,而6月8日至14日之间的概率也有68%。1 当然,这只是一个概率,不是承诺——但市场情绪往往比官方预告更敏锐。


Anthropic的算力困局:最强模型,最浅口袋

就在OpenAI磨刀霍霍的同时,Anthropic也没闲着。昨天,它向美国证券交易委员会(SEC)秘密提交了S-1文件,正式启动IPO流程。1

一方面,Claude Opus 4.8登顶Coding榜,Mythos在网安领域碾压对手,Claude Code在开发者社区口碑持续走高——模型能力这一项,Anthropic目前不虚任何人。1

另一方面,Anthropic的算力来源高度依赖亚马逊和谷歌的云基础设施,没有OpenAI背靠微软Azure那种独占算力协议,也没有谷歌DeepMind垂直整合的硬件优势。1 最强模型背后,是一个最“浅”的口袋。

这直接体现在定价策略上:Mythos的Token价格是Opus的6倍。为什么这么贵?因为推理成本高。在短期内可以靠能力领先撑住,但一旦OpenAI用更低的价格做到接近的能力,高价策略就变成了高价包袱。1

IPO就是Anthropic补上这块短板的关键。但钱什么时候到、到多少、够不够在算力军备竞赛中跟上节奏,全是未知数。

Anthropic提交S-1的次日早晨,OpenAI发布Codex重要里程碑——这要么是绝佳的时机,要么就是绝佳的时机。1


当模型能力趋近,非技术因素成为胜负手

这个季度内三次易主,本身就是AI历史上从未发生过的事。过去的技术竞赛,领先者的优势以年计——谷歌搜索引擎领先二十年,iOS和安卓格局十几年没本质变化。但在AGI竞赛最前沿,两家公司的差距已经压缩到了3.5分。1

这意味着什么?决定胜负的不再只是模型本身。

当模型能力趋近时,算力、资本、生态、速度、定价策略、甚至IPO时机——每一个非技术因素都在成为胜负手。1

  • Anthropic:有最强的模型,但需要IPO来补算力
  • OpenAI:有最深的口袋,但需要GPT-5.6来夺回王座
  • 谷歌:有最大的基础设施,但Gemini的Coding分数正在被拉开

人类历史上第一次,两家公司以周为单位争夺“最接近通用智能”的桂冠。1


今晚过后,排行榜会变吗?

有网友透露,OpenAI胸有成竹,志在必得:“GPT-5.6并非应对性发布。OpenAI志在取胜,而非追赶。”1

而真正的重头戏可能是GPT-6——据说该模型不仅旨在回应Anthropic的Mythos系列,更要以显著优势超越它。这或许解释了为什么OpenAI没有在Opus 4.8之后匆忙跟进。1

今晚OpenAI亮剑之后,81.01分的王座还能坐多久?

我们搬好小板凳,等直播开始。这周,注定不平静。


引用


  1. OpenAI今晚放大招!奥特曼亲自上阵,GPT-5.6本周反杀·新浪财经·新智元(2026/6/2)·检索日期2026/6/2 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. 最强牛马狙击编程之王,OpenAI和Anthropic深夜同发大招·36氪·字母AI(2026/6/2)·检索日期2026/6/2 ↩︎

  3. GPT-5.6 Release Date & What's New 2026·Codersera·(2026/6/2)·检索日期2026/6/2 ↩︎

  4. GPT-5.6 Canary Leak: What We Know·Wavespeed·(2026/6/2)·检索日期2026/6/2 ↩︎