TL;DR:
15分钟,这就是OpenAI给对手Anthropic留的“面子”。Claude 4.6刚发布,奥特曼反手就是一个GPT-5.3-Codex,不仅性能刷榜,还学会了“自己训练自己”,主打一个“我卷起来连自己都怕”。
就在今天凌晨,AI圈上演了一场现实版《速度与激情》。
Anthropic前脚刚发布号称“编程之神”的Claude Opus 4.6,还没等大家把测评报告写完,OpenAI后脚就甩出了重磅炸弹:GPT-5.3-Codex正式上线1。
这两家公司的“恩怨情仇”已经卷到了按分钟计时的程度。Anthropic那边还在炫耀Opus 4.6能用两周手搓一个C语言编译器2,OpenAI这边直接把“15分钟回击”打在了公屏上。网友直呼:这哪是发模型啊,这分明是神仙打架。
程序员的“嘴替”:它不仅懂你,甚至还懂美学?
说实话,以前的编程模型虽然强,但总给人一种“理工直男”的感觉。但这次GPT-5.3-Codex最让人惊艳的,是它终于有美学品味了3。
在官方展示的Demo中,它不仅能写逻辑,还能顺手把UI设计得非常有范儿。无论是赛车游戏还是潜水游戏,画面风格都相当在线。更离谱的是,即使你的Prompt(提示词)写得像甲方需求一样模糊,它也能自动补全逻辑,生成一个功能齐全的网站1。
“这哪里是代码助手,这分明是带了审美Buff的全栈工程师。”
在硬核指标上,GPT-5.3-Codex也没在怕的:
- 更聪明:在专为真实软件工程设计的SWE-Bench Pro测试中拿下了57%的高分,刷新了SOTA(行业最高水平)3。
- 更高效:完成同样任务,消耗的token不到5.2-Codex的一半,速度还提升了25%1。这简直是给老板省钱,给程序员省时间。
- 更全能:不仅会写代码,它的Computer Use(计算机使用)能力也拉满了。OSWorld基准测试得分64%,甚至能直接帮金融民工做PPT、填复杂的电子表格3。
终极套娃:AI开始“手搓”AI了?
如果说性能提升只是“意料之中”,那么这次OpenAI披露的一个细节则让人细思极恐:GPT-5.3-Codex竟然直接参与了自己的训练过程1。
这是OpenAI首个实现“自我加速”的模型。开发团队透露,他们在研发过程中使用了Codex的早期版本来调试训练流程、管理部署,甚至评估测试结果。
- 训练阶段:它负责监控和调试任务,分析模型行为变化。
- 数据处理:数据科学家在它的帮助下,不到三分钟就从数千个数据点中提炼出了核心洞见1。
这种“我训练我自己”的模式,让AI进化的逻辑从“线性”变成了“指数级”。当AI开始学会优化自己时,人类可能真的快要跟不上它的节奏了。
隐藏大招:要把AI同事和实验室都“包圆”了
除了Codex这个编程大杀器,OpenAI还顺带丢出了两个重磅消息。
一个是OpenAI Frontier。这不再只是个对话框,而是一个帮助企业打造“AI同事”的平台4。它支持共享上下文、实践学习,还有清晰的权限边界。HP、Uber、Oracle等大佬已经首批入驻。看来,以后入职的第一件事,可能不是领电脑,而是先给你的AI同事做“入职培训”。
另一个则是AI4S(AI for Science)的突破。OpenAI和合成生物学公司Ginkgo联手,让GPT-5接入了自主实验室。结果惊人:蛋白质合成的成本直接被打下来了40%3。这种从比特世界跨越到原子世界的控制力,预示着2026年将是科研范式彻底改变的一年。
不过,在评论区的一片欢呼声中,也有一丝不和谐的音符:“把4o还给我!”3
尽管GPT-5.3-Codex和Opus 4.6打得火热,但奥特曼至今仍未回应4o被彻底下架的真正原因。或许,他正忙着在下一场“15分钟对狙”中,憋出更惊人的大招。
引用
-
Introducing GPT-5.3 Codex · OpenAI · (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Claude Opus 4.6杀死编程比赛!挖出500个day0漏洞 · 智东西 · (2026/2/6) · 检索日期2026/2/6 ↩︎
-
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟 · 量子位 · Jay · (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
Introducing OpenAI Frontier · OpenAI · (2026/2/6) · 检索日期2026/2/6 ↩︎