标签
OpenAI 提出证据表明,像 o1 这样的推理模型在获得更多推理时计算来进行更深入思考时,对对抗攻击的抵抗力会增强。这项研究表明,增加计算量可以降低多种任务类型(包括数学、事实性和对抗性图像)的攻击成功率,尽管仍存在一些显著的例外。
OpenAI 向 API 发布 o1 模型,具备生产就绪的功能,包括函数调用、结构化输出、视觉能力,以及比 o1-preview 低 60% 的延迟。其他开发者工具包括 Realtime API 改进、偏好微调,以及新的 Go 和 Java SDK。
OpenAI 发布了 o1 系统卡,详细介绍了 o1 和 o1-mini 模型的安全评估和准备框架评估。这些模型采用思路链推理,并通过大规模强化学习进行训练,以提高安全性和稳健性。
OpenAI 发布了对参与 o1 模型评估和安全测试的外部测试者和红队人员的致谢。该文档列出了参与红队测试和防准备协作工作的个人和组织。
OpenAI 发布了 o1 模型系列,该模型具备扩展推理能力,通过在回应前花费更多时间思考,来解决科学、编码和数学领域的复杂问题。