GPT-5.6“日月地”三兄弟炸场：性能碾压Mythos，价格却卷到骨折？但普通人暂时玩不了

TL;DR

OpenAI深夜憋了个大招，一口气放出GPT-5.6 Sol、Terra、Luna三款新模型，分别对应太阳、地球、月亮。旗舰Sol性能反超Anthropic的Mythos，价格却没涨；Terra能力对标GPT-5.5但便宜一半，Luna更是白菜价。但坏消息是：美国政府要求先“小范围预览”，普通用户还得再等等。

就在昨晚，当大多数人还在刷剧吃瓜时，OpenAI突然放出了GPT-5.6——等等，这型号怎么听着像手机迭代？而且这次不叫Pro、Mini、Instant了，直接整了个“宇宙三件套”：Sol（太阳）、Terra（地球）、Luna（月亮）。😏

名字很浪漫，但本质还是老配方：一个最强旗舰（Sol）、一个日常均衡（Terra）、一个便宜轻量（Luna）。只不过OpenAI这次把“卷”字写在了脸上——性能碾压上一代，价格却直接腰斩甚至脚踝斩。

价格亮出来，友商开始慌了

先说最刺激的部分：API定价。

Sol：输入5美元/百万token，输出30美元
Terra：输入2.5美元，输出15美元
Luna：输入1美元，输出6美元

什么概念？旗舰Sol直接对标的是GPT-5.5标准版的价格，而GPT-5.5 Pro依然是那个最贵的“富哥专属”（输入30/输出180美元，Sol的6倍）。[^1] 至于Terra，便宜了一半；Luna，只有GPT-5.5的五分之一。

翻译成人话：你花同样的钱，买到了更强的模型；或者花一半的钱，买到差不多强的模型。这波“加量还减价”，友商看了血压得飙到180。

性能有多猛？代码、生物、安全全面碾压

OpenAI这次放出的benchmark不多，但招招致命，集中在三个方向：代码、生物学、网络安全。

Terminal-Bench 2.1（模拟真实命令行开发流程）：Sol拿下88.8%的高分，Ultra模式更高；Terra也拿到84.3%，和Anthropic刚发布的Claude Fable 5持平。[^2]
GeneBench v1（基因组学分析）：Sol比GPT-5.5更强，而且用的token更少——效率拉满。
ExploitBench（漏洞利用测试）：Sol的表现和Mythos预览版相当，但只用了三分之一左右的输出token——换句话说，干了同样的活，只花三分之一的钱。

为了支撑这种能力，OpenAI给Sol塞了两个新机制：Max Reasoning Effort（最大推理强度，让模型多想一会儿）和Ultra Mode（超强模式，多个子智能体组团干活）。简单说就是：以前一个AI自己肝，现在变成AI经理带着一群小弟分工合作。[^1]

美国政府出手了：最强模型不能随便玩

按理说这么牛的模型应该立刻开放让大家嗨一把？结果OpenAI在公告里写了一句很扎心的话：“应美国政府要求，先只向一小群‘值得信赖的合作伙伴’进行有限预览。”[^2]

这不是开玩笑。两周前，Anthropic的Fable 5上线仅3天就被迫下线，原因就是美国政府发了出口管制指令，禁止外籍员工访问。这次GPT-5.6也一样，客户的访问申请需要美国政府一个一个批准。[^2]

OpenAI自己也吐槽了：“我们不认为这种政府审批流程应该成为长期默认做法，因为它剥夺了需要这些工具的用户、开发者、企业和网络防御者的使用权。”[^2] ——翻译一下就是：爹，你别管太宽，让我卖货。

但没办法，模型强到能搞漏洞研究、基因组分析、网络安全攻防，政府就不可能完全放手。OpenAI反复强调GPT-5.6没有触碰自己的“Cyber Critical门槛”，意思是“我还没强到能自主发起毁灭性攻击”，但显然美国政府不太信。

总结：一个新时代的开端

GPT-5.6这次发布，表面上是三款明星产品，骨子里却是前沿模型发布流程的一次政府“插队”。当模型能力开始触碰代码、生物、安全这些敏感领域，发布权就不再只属于公司自己了。

对我们普通人来说，好消息是：等几周后全面开放，你可能用更少的钱享受到更强的AI。坏消息是：如果美国政府继续收紧，说不定哪天连ChatGPT Plus用户也得“申请审批”了。

反正我是先把钱包准备好了，你呢？