奥特曼深夜“贴脸开大”！GPT-5.3-Codex半小时反杀，AI代写代码已进入“自我进化”时代

TL;DR：

硅谷深夜“春晚”开演：Anthropic刚发布Claude 4.6，OpenAI不到20分钟就反手甩出GPT-5.3-Codex。新模型不仅屠榜各项编程测试，最离谱的是它竟然学会了“自己生自己”，这波内卷建议程序员直接快进到带薪摸鱼。

硅谷的这届大佬，显然是都不打算睡觉了。

就在昨夜，Anthropic毫无征兆地突袭发布了旗舰模型Claude Opus 4.6，正当大家准备感叹“真香”时，OpenAI的奥特曼（Sam Altman）显然坐不住了。短短20分钟后，OpenAI直接祭出最强智能体编程模型——GPT-5.3-Codex。这种“贴脸开大”的竞争节奏，让围观群众纷纷直呼：这哪是发布会，这简直是修罗场实况转播！¹

技术大揭秘：这玩意儿到底怎么工作的？

如果你以为GPT-5.3-Codex只是个会写代码的“高级复读机”，那你就太天真了。它不仅完美继承了GPT-5.2的推理基因，运行速度还直接起飞，足足提升了25%。²

最硬核的地方在于，GPT-5.3-Codex是人类历史上首个在自身创造过程中发挥了关键作用的模型。简单来说，OpenAI的工程师们是在用它的早期版本来训练、部署和优化正式版。

调侃点评： 这种“我生了我自己”的套娃操作，让“生产队的驴”听了都得连夜写辞职信。

在硬核实测中，GPT-5.3-Codex在衡量现实世界软件工程能力的SWE-Bench Pro评测中创下了行业新高。² 不同于只测Python的传统测试，这个Pro版涵盖了四种主流语言，且能有效防御“数据污染”。更骚的是，它实现这一切所消耗的Token比以往任何模型都少。这就好比一个顶尖黑客，不仅手速快，而且每一行代码都直击要害。

行业“地震”：谁笑了谁哭了？

在这次深夜对决中，OpenAI和Anthropic显然走上了两条截然不同的“卷王”之路。

OpenAI走的是“激进派”： GPT-5.3-Codex不仅仅想帮你写代码，它想接管你的电脑。在OSWorld基准测试中，它展现出了惊人的计算机操作能力，从调试Bug到在表格里搞复杂数据分析，甚至能从零开始构建功能复杂的Web游戏。²
Anthropic走的是“学院派”： 相比之下，Claude Opus 4.6更侧重于思考深度和可靠性。正如行业观察家所言，如果你想写代码，去隔壁找OpenAI；如果你要处理复杂的商业决策或法律文档，Claude依然是那个稳健的老大哥。²

值得一提的是，OpenAI这次还特意给英伟达（NVIDIA）点了个赞。官方强调，GPT-5.3-Codex的训练和部署全是跑在NVIDIA GB200 NVL72系统上的。² 看来此前关于奥特曼对芯片不满的传闻，在强大的算力肌肉面前都成了过烟云烟。

未来预测：下一个“风口”在哪里？

随着Codex从“工具”进化为“通用协作者”，我们可能正在见证软件开发范式的彻底重写。

现在的GPT-5.3-Codex已经学会了如何与人类“协同作战”。你不用干等着结果，而是在它工作时实时引导、喊停或者微调方向。² 这种“中途喊停”的功能，极大地缓解了人类对AI失控的焦虑，同时也让开发效率翻倍。

此外，OpenAI还透露GPT-5.3-Codex是首个在网络安全相关任务中被归类为“高能力”的模型。³ 它不仅能写代码，还能直接识别漏洞。这意味着，未来的网络安全攻防战，可能就是两群AI智能体在纳秒级的时间尺度内互相拆招了。

引用

AI War: 20 Minutes After Claude Opus 4.6, OpenAI Strikes Back With GPT-5.3 Codex · UCStrategies · (2026/2/6) · 检索日期2026/2/6 ↩︎
ChatGPT and Claude Undergo Major Updates Simultaneously · 36氪 · (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
OpenAI's GPT-5.3-Codex drops as Anthropic upgrades Claude · VentureBeat · (2026/2/6) · 检索日期2026/2/6 ↩︎