OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5

OpenAI 于 6 月 27 日正式推出了其最新的 AI 模型系列 GPT-5.6。根据美国政府的要求，目前该系列模型仅对部分“可信赖的合作伙伴”提供预览访问权限，尚未全面开放。

本次发布的 GPT-5.6 模型系列包含三个不同版本：

旗舰版 Sol：每百万输入 Token 费用为 5 美元（约合人民币 34 元），每百万输出 Token 费用为 30 美元（约合人民币 204.3 元）。
均衡版 Terra：每百万输入 Token 费用为 2.5 美元（约合人民币 17 元），每百万输出 Token 费用为 15 美元（约合人民币 102.1 元）。
Luna：该版本侧重于速度和成本效益，每百万输入 Token 费用为 1 美元（约合人民币 6.8 元），每百万输出 Token 费用为 6 美元（约合人民币 40.9 元）。

OpenAI 还宣布，已经优化了提示词缓存机制，这将使得重复提示词的调用更加经济且可预测。

在性能表现方面，OpenAI 表示 GPT-5.6 Sol 是其迄今为止最强大的模型，具备新的 Max 推理能力，并引入了 Ultra 模式，利用子智能体技术加速复杂任务的处理。

在编程能力测试中，GPT-5.6 Sol 在 Terminal-Bench 2.1 基准测试中取得了新高。在标准模式下，其得分为 88.8%，超过了 Claude Mythos 5 的 88.0%。当启用 Ultra 模式后，得分进一步提升至 91.9%。

在生物学领域的 GeneBench v1 测试中，GPT-5.6 Sol 在消耗更少 Token 的情况下，性能表现优于 GPT-5.5。

网络安全领域也看到了 GPT-5.6 Sol 的显著进步，尤其是在漏洞研究和利用等需要长链条推理的安全任务上。在 ExploitBench 测试中，该模型仅使用约三分之一的输出 Token 即可达到与 Mythos Preview 相似的性能水平。

在安全设计方面，GPT-5.6 Sol、Terra 和 Luna 模型采用了多层防护体系。这包括模型内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问控制、监控以及执法机制。对于检测到的高风险情况，系统可以暂停生成过程，并将其交由更强大的推理模型进行复核。如果内容被判定为违规，将在展示前被拦截。

OpenAI 计划在未来几周内逐步上线 GPT-5.6 Sol、Terra 和 Luna 模型。此外，OpenAI 还计划在 7 月份于 Cerebras 平台推出 GPT-5.6 Sol，该版本的最高处理速度可达每秒 750 个 Token，初期将仅面向部分客户开放。

OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5 - 沙巴体育APP