OpenAI已推出其最新一代AI模型的受限早期预览版,该系列统称为GPT-5.6,包含三个变体:Sol、Terra和Luna。公司首先向美国政府批准的一小批可信合作伙伴开放这些模型,随后将逐步扩大分发范围。此次发布标志着前沿AI系统快速发展的又一里程碑,同时也凸显出对强大新模型日益严格的监管审查。在正式公布前,OpenAI向政府官员展示了这些模型的能力,并应政府要求同意限制初始访问权限。
Sol作为旗舰模型,专为最复杂的推理和智能代理任务设计。Terra提供平衡型选择,定位于日常高负荷工作,成本低于顶级版本。Luna则为轻量级任务提供更快且更具性价比的性能。据OpenAI介绍,与以往版本相比,新系列在编码、科学分析和网络安全任务等领域实现了显著改进。公司强调了这些模型在Terminal-Bench 2.1等复杂命令行工作流基准测试中的优异表现。此次发布前不久,OpenAI通过额外获得100亿美元融资强化了财务实力,为扩展AI基础设施和加速未来前沿模型开发提供了更充足的资源。这笔投资预计将支持公司的长期AI路线图,同时行业内的竞争也在持续加剧。
OpenAI表示,作为持续合作的一部分,公司已向美国政府提前通报了计划及模型能力。初始受限预览版仅面向特定可信合作伙伴,其参与信息已与当局共享。公司计划在未来数周内扩大可用范围。在公告中,OpenAI指出,并不认为此类政府审批流程是理想的长期标准。官方官员以国家安全和网络安全为由要求采取分阶段发布方式。这一决定与近期一项旨在评估先进AI系统在公开部署前安全性行政令相吻合。分阶段发布也反映出AI行业更广泛的转变——各国政府在AI系统公开发布前正在发挥更积极的审查作用。类似的监管挑战近期也影响了Anthropic公司,其最新的Claude模型因美国出口管制政策而面临限制,凸显出AI创新与国家安全之间日益紧密的交织。
这些模型搭载了OpenAI迄今为止最强大的安全措施。其中包括针对敏感领域(如攻击性网络行动)滥用的强化防护。测试表明,这些模型能够有效协助漏洞研究和防御性安全工作,同时在评估中不会使模型具备对加固目标进行完全自主端到端攻击的能力。OpenAI强调,GPT-5.6 Sol在其内部准备度框架中仍低于“网络关键”阈值。公司在预览阶段继续进行红队测试和实时监控。
在受限预览期间,经批准的合作伙伴可通过OpenAI API和Codex平台获取访问权限。Sol的标准定价为每百万输入代币5美元,每百万输出代币30美元,Terra和Luna的价格更低。向ChatGPT用户及普通API客户的更广泛开放预计很快实施。此次受控发布反映了AI领域创新速度与风险管理之间不断演变的平衡。随着模型能力不断提升,领先开发者与政策制定者之间的协调正成为常规做法,即便企业仍在推动建立可预测且有利于创新的框架。