TL;DR:
别再催GPT-5.6了,OpenAI悄悄把GPT-5.5打造成了网络安全界的"特种兵"——GPT-5.5-Cyber完整版上线,在CyberGym基准上怒刷85.6%,直接把Anthropic的Mythos 5(83.8%)按在地上摩擦,顺带还搞了个"补丁地球"计划,要让开源项目的漏洞修复速度跟上AI的发现速度。1
开门见山:这不是你要的GPT-5.6,但可能更实用
当全网都在眼巴巴等GPT-5.6的时候,OpenAI反手掏出了——GPT-5.5-Cyber完整版。
别急着失望。这个"安全专用版"可不是简单套个皮肤。它是OpenAI Daybreak计划的核心弹药,专为"授权的高级防御任务"量身定制。简单说:它被训练成一台漏洞挖掘机+自动补丁生成器,而且比普通GPT-5.5在安全任务上强了一截。
CyberGym基准测试就是它的秀场:85.6%,直接干翻GPT-5.5的81.8%和Anthropic Mythos 5的83.8%。12 用奥特曼的话说:"当前SOTA(最先进水平)表现。"3
翻译成人话:现在AI修漏洞的速度,可能比你点外卖还快。
三头六臂的Daybreak,不只是个模型
OpenAI这次不是单一发布,而是搞了个"安全全家桶"——Daybreak计划一口气更新了四样东西:
- GPT-5.5-Cyber完整版:之前只是预览,现在正式面向可信防守方开放。能够在大代码库里持续深入分析,识别安全组件、追踪漏洞是否可达、验证、开发补丁,一套闭环走完。不再是"发现漏洞就跑",而是"发现并修好你"。1
- Codex Security插件更新:从内部使用经验中沉淀出来的工具,帮你把漏洞发现直接变成修复。已经扫描了超过3000万次提交,覆盖3万多个代码库,人工标记修复超过7万个。1
- Patch the Planet(补丁地球):和Trail of Bits、HackerOne合作,专门帮助开源项目从"发现漏洞"走向"真正修复"。首个冲刺就发现了数百个问题,合并了数十个补丁。1
- Daybreak Cyber Partner Program:让安全合作伙伴在自己的产品里访问这些模型,把AI安全能力扩散到更多组织。1
基准测试只是开胃菜,真实场景才是硬菜
数据说话:在ExploitGym上(测试把漏洞变成实际利用的能力),GPT-5.5-Cyber得分39.5%,而GPT-5.5只有25.95%——这是质的飞跃。在SEC-bench Pro上(长周期漏洞发现和概念验证生成),69.8% vs 63.1%,同样领先。1
但OpenAI自己也说了:基准测试只是故事的一部分。真正重要的是,在Firefox、V8、Safari、OpenBSD、FreeBSD等实际系统里,它已经帮防守方找到了并验证了真漏洞。1
网友的反应:我们想要GPT-5.6啊喂!
不过社交媒体上的画风略显"凡尔赛":网友们纷纷表示——"所以GPT-5.6到底什么时候出?" 1
确实,对于普通用户来说,安全专用模型远不如一次模型迭代来得兴奋。但换个角度看:OpenAI正在把AI能力从"聊天玩具"推向"关键基础设施守护者"。这种"偏科"式的专注,也许比发布一个通用大模型更有实际意义。
补丁地球:开源维护者的"救星"还是"新压力"?
Patch the Planet这个名字就很中二,但做的事情很务实。开源软件撑起了整个数字世界,但很多项目就靠几个人维护。AI能更快发现漏洞,但也意味着给维护者塞来更多报告——其中很多是误报或低质量报告。
这个计划的解决方案是:给维护者配上专业安全研究人员+AI工具,由研究人员端到端管理漏洞验证和补丁生成,最后只把"已经修好的补丁"交给维护者审阅。1 说白了,就是让AI做脏活累活,让人类做最后决策——这才是负责任的AI部署方式。
对比Anthropic:OpenAI的选择是"发出去,但要管好"
Anthropic的Claude Mythos 5之前也被定位为网络安全专用模型,但他们的策略更谨慎:担心能力太强被滥用,所以不广泛开放。OpenAI的Daybreak则走了另一条路:通过分级访问(GPT-5.5基础版 → Trusted Access版 → GPT-5.5-Cyber完整版)、严格的验证机制和合作伙伴计划,让有能力的人用上最强工具,同时把滥用风险锁在笼子里。24
一句话总结:Anthropic选择"藏着掖着",OpenAI选择"发出去,但管好"。谁对?现在下结论还早,但至少OpenAI的分数更高。
接下来呢?
Daybreak不只是一个产品发布,更像是一个信号:AI安全已经从"纸上谈兵"进入"工具化作战"阶段。OpenAI明确表态——要超越"用模型发现更多漏洞",走向"软件更安全、网络韧性更强的世界"。1
对于企业安全团队来说,GPT-5.5 with Trusted Access for Cyber + Codex Security已经是一个可用的起点。对于渴望见识AI真正实力的吃瓜群众,GPT-5.5-Cyber完整版证明了:当AI认真起来,人类修Bug的速度真的不够看。
至于GPT-5.6?催归催,但奥特曼可能正在忙着给地球打补丁呢。
-
OpenAI发布Daybreak安全计划,推出GPT-5.5-Cyber完整版、Codex Security等·机器之心(2026/6/23)·检索日期2026/6/23 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
OpenAI launches Daybreak to take on Anthropic’s Mythos in cyber defence·The Next Web(2026/6/23)·检索日期2026/6/23 ↩︎ ↩︎
-
奥特曼(Sam Altman)推文·X(2026/6/23)·检索日期2026/6/23 ↩︎
-
Anthropic: “Claude Mythos is too cyber-capable to release broadly” vs OpenAI: “Here’s GPT-5.5-Cyber”·X用户@kimmonismus(2026/6/23)·检索日期2026/6/23 ↩︎