代码界半夜惊雷!OpenAI 祭出“闪电侠”,谷歌掏出“深思怪”,程序员的班还能加多久?

温故智新AIGC实验室

TL;DR:

OpenAI 联手 Cerebras 推出了“快到没朋友”的 Codex-Spark,主打零延迟实时协作;谷歌则反手甩出一个“脑回路极深”的 Gemini 3 Deep Think,专门硬刚连人类都头大的科研难题。两家巨头再次同台打擂:一个卷速度,一个卷智商,程序员们,你们的“AI 队友”又升级了!

大模型圈子的“周四见”果然从不让人失望。昨晚,OpenAI 和谷歌这两位老冤家几乎同时按下了核武发射键,丢出了两枚针对程序员和科学家的“代码核弹”。

如果你还在抱怨 AI 写代码像挤牙膏、等个回复能喝完一杯咖啡,那这两份“惊喜”可能会让你瞬间清醒。

OpenAI 的“闪电战”:既然卷不动智商,那就卷速度?

OpenAI 昨晚发布的 GPT-5.3-Codex-Spark 很有意思。它不是那种力大砖飞、动辄几千亿参数的巨无霸,而是从 GPT-5.3 主模型中“精修”出来的“轻骑兵”1

它的核心卖点就一个字:

以往我们用 AI 编程,更像是在发邮件:你写个需求,它在那儿憋半天,最后吐出一大段代码,你再慢慢改。而 Codex-Spark 想做的是“读心术”——在你想改代码的那一秒,它就反馈了。

为了实现这种“零延迟”的快感,OpenAI 这次甚至不惜“出轨”。他们为了摆脱对英伟达芯片的过度依赖,砸了 100 多亿美元找芯片初创公司 Cerebras 合作2。这次的 Spark 模型就是运行在 Cerebras 硬件上的第一个里程碑3

调侃点评: 看来奥特曼(Sam Altman)也明白,只要我跑得够快,延迟就追不上我。这波操作直接把客户端/服务器单次往返开销降低了 80%1。这就是传说中的“天下武功,唯快不破”?

不过,社区里的“清醒派”也很多。有人在 X 上直接开怼:如果代码写得又快又烂,那它也就是个“更先进的自动补全”而已。Spark 能否在保持 1000 tokens/s 这种“非人”速度的同时,不写出 Bug 满天飞的代码,还得打个问号。

谷歌的“深呼吸”:如果 AI 开始搞科研,人类还有戏吗?

如果说 OpenAI 在玩“极速赛车”,那谷歌的 Gemini 3 Deep Think 就在玩“深度潜水”。

谷歌这次更新的模型,目标根本不是为了陪你聊天。它请来了清华物理系的大神姚顺宇坐镇,专门解决那些“没标准答案、没固定套路、数据还贼乱”的硬核科研问题1

来看看这位“学霸”的成绩单:

  • 编码力: 在 Codeforces 上拿到了 3455 的 Elo 评分,排名世界前 81
  • 科研力: 帮罗格斯大学的数学家找出了连人工同行评审都没发现的逻辑漏洞1
  • 硬核度: 在所谓的“人类最后考验”(Humanity’s Last Exam)中拿到了 48.4% 的高分1

调侃点评: 排名世界第 8?这就是那种典型的“比你聪明还比你努力”的邻家小孩。当你在为修复一个 CSS 样式发愁时,它可能正在帮物理学家弥合引力理论和量子力学之间的鸿沟。

最骚的是,Gemini 3 Deep Think 还能把草图直接转成 3D 打印模型。一位亚马逊工程师直言:我们正在从“聊天时代”迈向“推理时代”1

行业“地震”:谁笑了谁哭了?

这两枚核弹落下来,最先感受到震感的恐怕是那些二线 AI 编程助手。

OpenAI 证明了:通过系统级的优化(改写推理栈、用 WebSocket 持久连接),AI 的响应速度可以达到接近人类感官的极限1。这对于那些追求“交互感”的开发者来说,诱惑力极大。

而谷歌则划出了另一条护城河:深度推理。当 AI 开始具备处理凝聚态物理这类高度抽象领域的能力时1,它就不再是一个简单的工具,而是一个真正的“数字大脑”。

总结一下:

  1. OpenAI:极致的协作效率。你还没想好怎么写,它的建议已经蹦出来了。
  2. 谷歌:极致的逻辑深度。你想不通的科研难题,它帮你通。

在这场诸神黄昏般的对决中,最开心的可能是那些“拿 AI 当外挂”的顶级黑客和科学家;而最焦虑的,可能还是那些只会搬运代码、还跑不过 AI 的“初级码农”。

最后,别忘了那个 128k 的上下文窗口1。这不仅意味着模型能记住更多的代码,也意味着它能看穿你更多的逻辑漏洞。未来,也许不是 AI 替代了你,而是那个“会用闪电侠和奇异博士当助手的程序员”替代了你。

引用