我们开始对 GPT-5.6 系列进行有限预览:Sol 是我们的旗舰模型;Terra 是适用于日常工作的均衡模型;Luna 是快速且经济实惠的模型。Terra 具有与 GPT-5.5 相当的性能,但价格仅为其一半;Luna 以我们最低的成本提供强大的能力。
GPT-5.6 Sol 搭载了我们迄今为止最强大的安全防护体系。我们加强了对高风险活动、敏感网络安全请求和反复滥用的保护,并花费数周时间寻找弱点、对系统进行压力测试,并针对真实世界的攻击进行加固。
我们相信广泛访问的价值,并计划在未来几周内让 GPT-5.6 Sol、Terra 和 Luna 全面可用。作为我们与美国政府持续互动的一部分,我们在今天发布之前提前告知了我们的计划和模型能力。应他们的要求,我们从一小群值得信赖的合作伙伴开始进行有限预览,这些合作伙伴的参与情况已告知政府,然后再进行更广泛的发布。在此预览期间,我们将继续测试并与合作伙伴密切协调,努力实现更广泛的可用性。我们认为这种政府准入流程不应成为长期默认模式。它将最好的工具挡在了用户、开发者、企业、网络安全防御者和需要它们的全球合作伙伴之外。我们采取这一短期措施,是因为我们相信这是未来几周实现更广泛可用性的最有力路径,同时我们正与政府合作制定网络安全行政令框架以及未来模型发布的可重复流程。
能力
GPT-5.6 Sol 是我们迄今为止最强大的模型。为了预览模型性能,我们分享了一组评估结果,展示了在编码、生物学和网络安全方面改进的智能体能力,更多安全和准备性评估请参阅我们的系统卡。当模型全面可用时,我们将分享更广泛的评估结果。
通过 GPT-5.6,我们引入了新的 max 推理努力级别,让 Sol 有最多的时间进行深度推理。此外,我们还引入了新的 ultra 模式,它超越了单一智能体的能力,利用子智能体来加速复杂工作。
对于编码工作流,GPT-5.6 Sol 在 Terminal-Bench 2.1 上创下了新的业界最佳水平,该基准测试需要规划、迭代和工具协调的命令行工作流。
TerminalBench 2.1
| 模型 | 得分 |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.6 Terra | 84.3% |
| Claude Fable 5 | 84.3% |
| GPT-5.5 | 83.4% |
| GPT-5.6 Luna | 82.5% |
| Claude Opus 4.8 | 78.9% |
| Gemini 3.1 Pro Preview | 70.7% |
GPT-5.6 Sol 在生物学工作流方面也展现出广泛的改进。在 GeneBench v1(评估长周期基因组学和定量生物学分析)上,它比 GPT-5.5 取得了更好的结果,同时使用了更少的 Token。
GeneBench v1
在 GeneBench v1 基准测试中,GPT-5.6 Sol、Terra 和 Luna 均展现出比 GPT-5.5 更强的性能,且消耗的输出 Token 更少。
GPT-5.6 Sol 是我们迄今为止在网络安全方面最强大的模型。它改变了长周期安全任务(包括漏洞研究和漏洞利用)的性能-效率前沿。在 ExploitBench 上,GPT-5.6 Sol 仅使用约 1/3 的输出 Token 就能与 Mythos Preview 相媲美。在 ExploitGym(由加州大学伯克利分校研究人员与 OpenAI 及其他前沿实验室合作创建的基准测试)上,随着我们增加推理量,GPT-5.6 Sol、Terra 和 Luna 模型都展现出网络安全能力的显著提升。
更强的网络安全能力与更强的防护措施
我们开发 GPT-5.6 Sol、Terra 和 Luna 时配备了迄今为止最强大的防护措施,并根据每个模型的能力进行了相应配置。随着模型能力的增强,我们设计的防护措施能够越来越多地抵御真实世界的对抗压力,同时保留对合法工作的访问,例如代码审查、漏洞研究、补丁开发、调试、安全教育和防御性测试。我们的目标是让被禁止的攻击活动变得更加困难、不确定和可检测,同时不对这些有益用途进行不必要的限制。基于我们对模型和防护措施的评估,我们预计合法防御工作将获得实质性收益,同时有效约束被禁止的攻击性使用。
GPT-5.6 Sol 更擅长帮助人们发现和修复漏洞,而不是可靠地执行端到端攻击。随着这些能力的不断进步,我们的首要任务是确保它们能够惠及防御者,他们可以使用这些工具来发现弱点、开发补丁并更广泛地加强系统。
在我们的准备框架下,GPT-5.6 Sol 未达到网络安全关键(Critical)阈值。在涉及 Chromium 和 Firefox 的评估中,它识别出了漏洞和利用原语——漏洞利用的构建块——但在测试条件下未能自主生成功能完整的全链漏洞利用。尽管如此,基准阈值无法捕捉模型可能被使用或与其他工具结合的每种方式。这种不确定性,加上模型能力的更广泛阶跃变化,正是我们将模型增强的能力与更强的防护措施和分阶段发布相结合的原因。我们在 GPT-5.6 预览系统卡中分享了更多关于我们防护措施的细节。
分层防护栈
没有任何单一的防护措施足以应对坚决的或适应性的滥用。在 GPT-5.6 预览中,我们使用分层防护措施,具体配置因模型而异,并针对真实世界的攻击进行压力测试。这些包括训练到模型中的保护、生成过程中的实时检查、账户级信号、差异化访问、监控、执行和持续测试。
GPT-5.6 经过训练,会拒绝提供被禁止的网络安全帮助,包括当用户试图掩饰其意图或越狱模型时。这些模型级防护措施建立了关于模型应该和不应该帮助什么的第一道边界。
实时网络安全和生物学滥用分类器通过在生成输出时对其进行评估,提供了另一层防护。对于高风险案例,如果它们检测到潜在违规,生成可能会暂停,同时由更大的推理模型审查对话及其上下文。如果输出被评估为不允许,则在到达用户之前就会被拦截。
被标记的活动还可能触发对相关对话和风险信号的账户级审查,这与我们关于内容保留和审查的条款和政策一致。超越单一对话进行观察有助于我们的系统区分持续的恶意行为与合法的两用安全工作,在这些工作中,类似的技术概念可能出现在非常不同的上下文中。
这些层共同使整体方法比任何单一防护措施更稳健。模型行为降低了有害响应的可能性,实时系统可以在生成过程中进行干预,账户级审查可以识别更广泛的模式,差异化访问保护了重要的防御工作,同时不会默认让最敏感的能力广泛可用。
特别是在预览期间,我们将与合作伙伴密切合作,了解现实世界的使用模式,并在我们向更广泛的可用性推进时快速迭代我们的防护措施。
通过自动化红队提升稳健性
为了在发布前找到并修复漏洞,我们进行了广泛的红队测试——由人类专家和自动化系统共同执行。我们的自动化红队系统专门用于发现可用于绕过我们的安全防护的通用方法,花费了超过 700,000 个 A100e GPU 小时来寻找通用越狱。我们发现的漏洞已在发布前得到修复,我们将在部署期间持续运行自动化红队。随着新的越狱被报告,我们会重现、缓解并重新测试它们,以便及时弥补漏洞。
我们还与外部研究人员和红队人员合作,他们使用各种方法来寻找我们防护措施中的漏洞。这包括针对网络安全能力的专业红队、针对生物学风险的领域专家,以及寻找创造性地尝试绕过我们系统的通用对抗性测试人员。
可用性与定价
GPT-5.6 系列目前处于有限预览阶段,仅向一小群经过验证的可信合作伙伴提供。我们计划在未来几周内扩大访问范围并全面可用。
三款模型的定价如下:
- Sol(旗舰模型):每百万 Token 输入 5.00 美元,输出 30.00 美元
- Terra(均衡模型):每百万 Token 输入 2.50 美元,输出 15.00 美元
- Luna(快速经济模型):每百万 Token 输入 1.00 美元,输出 6.00 美元
缓存机制也进行了升级:新增显式缓存断点,缓存最短保留时间为 30 分钟,缓存写入按非缓存输入价格的 1.25 倍计费,缓存读取仍维持 90% 的折扣。
GPT-5.6 引入了新的推理努力级别和模式:
max推理努力:为 Sol 提供最深层次的推理时间ultra模式:利用子智能体架构,将复杂任务拆解后并行处理,再汇总执行
OpenAI 还计划将 Sol 部署到 Cerebras 的芯片上,目标是在 7 月将推理速度提升到每秒 750 个 Token。
在网络安全方面,我们延续了受信访问框架:
- 网络安全受信访问(Trusted Access for Cyber, TAC):对于经过验证的网络安全防御者,放宽部分分类器限制
- 最敏感的能力:继续保留给经过严格审核的可信防御者
随着我们在未来几周内扩大可用性,我们将分享更多关于 ChatGPT、Codex 和 API 可用性的细节。