TL;DR:
硅谷深夜“春晚”开演:Anthropic刚发布Claude 4.6,OpenAI不到20分钟就反手甩出GPT-5.3-Codex。新模型不仅屠榜各项编程测试,最离谱的是它竟然学会了“自己生自己”,这波内卷建议程序员直接快进到带薪摸鱼。
硅谷的这届大佬,显然是都不打算睡觉了。
就在昨夜,Anthropic毫无征兆地突袭发布了旗舰模型Claude Opus 4.6,正当大家准备感叹“真香”时,OpenAI的奥特曼(Sam Altman)显然坐不住了。短短20分钟后,OpenAI直接祭出最强智能体编程模型——GPT-5.3-Codex。这种“贴脸开大”的竞争节奏,让围观群众纷纷直呼:这哪是发布会,这简直是修罗场实况转播!1
技术大揭秘:这玩意儿到底怎么工作的?
如果你以为GPT-5.3-Codex只是个会写代码的“高级复读机”,那你就太天真了。它不仅完美继承了GPT-5.2的推理基因,运行速度还直接起飞,足足提升了25%。2
最硬核的地方在于,GPT-5.3-Codex是人类历史上首个在自身创造过程中发挥了关键作用的模型。简单来说,OpenAI的工程师们是在用它的早期版本来训练、部署和优化正式版。
调侃点评: 这种“我生了我自己”的套娃操作,让“生产队的驴”听了都得连夜写辞职信。
在硬核实测中,GPT-5.3-Codex在衡量现实世界软件工程能力的SWE-Bench Pro评测中创下了行业新高。2 不同于只测Python的传统测试,这个Pro版涵盖了四种主流语言,且能有效防御“数据污染”。更骚的是,它实现这一切所消耗的Token比以往任何模型都少。这就好比一个顶尖黑客,不仅手速快,而且每一行代码都直击要害。
行业“地震”:谁笑了谁哭了?
在这次深夜对决中,OpenAI和Anthropic显然走上了两条截然不同的“卷王”之路。
- OpenAI走的是“激进派”: GPT-5.3-Codex不仅仅想帮你写代码,它想接管你的电脑。在OSWorld基准测试中,它展现出了惊人的计算机操作能力,从调试Bug到在表格里搞复杂数据分析,甚至能从零开始构建功能复杂的Web游戏。2
- Anthropic走的是“学院派”: 相比之下,Claude Opus 4.6更侧重于思考深度和可靠性。正如行业观察家所言,如果你想写代码,去隔壁找OpenAI;如果你要处理复杂的商业决策或法律文档,Claude依然是那个稳健的老大哥。2
值得一提的是,OpenAI这次还特意给英伟达(NVIDIA)点了个赞。官方强调,GPT-5.3-Codex的训练和部署全是跑在NVIDIA GB200 NVL72系统上的。2 看来此前关于奥特曼对芯片不满的传闻,在强大的算力肌肉面前都成了过烟云烟。
未来预测:下一个“风口”在哪里?
随着Codex从“工具”进化为“通用协作者”,我们可能正在见证软件开发范式的彻底重写。
现在的GPT-5.3-Codex已经学会了如何与人类“协同作战”。你不用干等着结果,而是在它工作时实时引导、喊停或者微调方向。2 这种“中途喊停”的功能,极大地缓解了人类对AI失控的焦虑,同时也让开发效率翻倍。
此外,OpenAI还透露GPT-5.3-Codex是首个在网络安全相关任务中被归类为“高能力”的模型。3 它不仅能写代码,还能直接识别漏洞。这意味着,未来的网络安全攻防战,可能就是两群AI智能体在纳秒级的时间尺度内互相拆招了。
引用
-
AI War: 20 Minutes After Claude Opus 4.6, OpenAI Strikes Back With GPT-5.3 Codex · UCStrategies · (2026/2/6) · 检索日期2026/2/6 ↩︎
-
ChatGPT and Claude Undergo Major Updates Simultaneously · 36氪 · (2026/2/6) · 检索日期2026/2/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
OpenAI's GPT-5.3-Codex drops as Anthropic upgrades Claude · VentureBeat · (2026/2/6) · 检索日期2026/2/6 ↩︎