TL;DR
OpenAI深夜憋了个大招,一口气放出GPT-5.6 Sol、Terra、Luna三款新模型,分别对应太阳、地球、月亮。旗舰Sol性能反超Anthropic的Mythos,价格却没涨;Terra能力对标GPT-5.5但便宜一半,Luna更是白菜价。但坏消息是:美国政府要求先“小范围预览”,普通用户还得再等等。
就在昨晚,当大多数人还在刷剧吃瓜时,OpenAI突然放出了GPT-5.6——等等,这型号怎么听着像手机迭代?而且这次不叫Pro、Mini、Instant了,直接整了个“宇宙三件套”:Sol(太阳)、Terra(地球)、Luna(月亮)。😏
名字很浪漫,但本质还是老配方:一个最强旗舰(Sol)、一个日常均衡(Terra)、一个便宜轻量(Luna)。只不过OpenAI这次把“卷”字写在了脸上——性能碾压上一代,价格却直接腰斩甚至脚踝斩。
价格亮出来,友商开始慌了
先说最刺激的部分:API定价。
- Sol:输入5美元/百万token,输出30美元
- Terra:输入2.5美元,输出15美元
- Luna:输入1美元,输出6美元
什么概念?旗舰Sol直接对标的是GPT-5.5标准版的价格,而GPT-5.5 Pro依然是那个最贵的“富哥专属”(输入30/输出180美元,Sol的6倍)。[^1] 至于Terra,便宜了一半;Luna,只有GPT-5.5的五分之一。
翻译成人话:你花同样的钱,买到了更强的模型;或者花一半的钱,买到差不多强的模型。这波“加量还减价”,友商看了血压得飙到180。
性能有多猛?代码、生物、安全全面碾压
OpenAI这次放出的benchmark不多,但招招致命,集中在三个方向:代码、生物学、网络安全。
- Terminal-Bench 2.1(模拟真实命令行开发流程):Sol拿下88.8%的高分,Ultra模式更高;Terra也拿到84.3%,和Anthropic刚发布的Claude Fable 5持平。[^2]
- GeneBench v1(基因组学分析):Sol比GPT-5.5更强,而且用的token更少——效率拉满。
- ExploitBench(漏洞利用测试):Sol的表现和Mythos预览版相当,但只用了三分之一左右的输出token——换句话说,干了同样的活,只花三分之一的钱。
为了支撑这种能力,OpenAI给Sol塞了两个新机制:Max Reasoning Effort(最大推理强度,让模型多想一会儿)和Ultra Mode(超强模式,多个子智能体组团干活)。简单说就是:以前一个AI自己肝,现在变成AI经理带着一群小弟分工合作。[^1]
美国政府出手了:最强模型不能随便玩
按理说这么牛的模型应该立刻开放让大家嗨一把?结果OpenAI在公告里写了一句很扎心的话:“应美国政府要求,先只向一小群‘值得信赖的合作伙伴’进行有限预览。”[^2]
这不是开玩笑。两周前,Anthropic的Fable 5上线仅3天就被迫下线,原因就是美国政府发了出口管制指令,禁止外籍员工访问。这次GPT-5.6也一样,客户的访问申请需要美国政府一个一个批准。[^2]
OpenAI自己也吐槽了:“我们不认为这种政府审批流程应该成为长期默认做法,因为它剥夺了需要这些工具的用户、开发者、企业和网络防御者的使用权。”[^2] ——翻译一下就是:爹,你别管太宽,让我卖货。
但没办法,模型强到能搞漏洞研究、基因组分析、网络安全攻防,政府就不可能完全放手。OpenAI反复强调GPT-5.6没有触碰自己的“Cyber Critical门槛”,意思是“我还没强到能自主发起毁灭性攻击”,但显然美国政府不太信。
总结:一个新时代的开端
GPT-5.6这次发布,表面上是三款明星产品,骨子里却是前沿模型发布流程的一次政府“插队”。当模型能力开始触碰代码、生物、安全这些敏感领域,发布权就不再只属于公司自己了。
对我们普通人来说,好消息是:等几周后全面开放,你可能用更少的钱享受到更强的AI。坏消息是:如果美国政府继续收紧,说不定哪天连ChatGPT Plus用户也得“申请审批”了。
反正我是先把钱包准备好了,你呢?