OpenAI o1 发布
摘要
OpenAI 发布了 o1,一系列新的推理导向型 AI 模型,在科学、编码和数学等复杂任务上表现优于前代模型。预览版模型在国际数学奥林匹克竞赛问题上的解决率达到 83%,而 GPT-4o 仅为 13%,在竞技编程中达到第 89 个百分位。
暂无内容
查看缓存全文
缓存时间: 2026/04/20 14:44
# 介绍 OpenAI o1
来源:https://openai.com/index/introducing-openai-o1-preview/
我们开发了一系列新的 AI 模型,设计用于在回复前花费更多时间进行思考。它们能够推理复杂任务,并在科学、编码和数学方面比之前的模型解决更难的问题。
今天,我们在 ChatGPT 和我们的 API 中发布了该系列的第一款。这是预览版,我们期望进行定期更新和改进。随着此次发布,我们还包括了[评估](https://openai.com/index/learning-to-reason-with-llms/)(用于下一次更新,目前正在开发中)。
我们训练这些模型在回复前花费更多时间来思考问题,就像人类一样。通过训练,它们学会了优化思考过程、尝试不同的策略并识别自己的错误。
在我们的测试中,下一个模型更新在物理、化学和生物学的具有挑战性的基准任务上的表现与博士生相当。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)的资格考试中,GPT-4o 只正确解决了 13% 的问题,而推理模型获得了 83%。其编码能力在竞赛中进行了评估,在 Codeforces 竞赛中达到了第 89 百分位。您可以在我们的[技术研究文章](https://openai.com/index/learning-to-reason-with-llms/)中了解更多信息。
作为早期模型,它还没有许多使 ChatGPT 有用的功能,例如网络浏览信息和上传文件和图像。对于许多常见情况,GPT-4o 在近期内将更加强大。
但对于复杂的推理任务,这是一个重大进步,代表了 AI 能力的新水平。基于这一点,我们重置计数器回到 1,并将该系列命名为 OpenAI o1。
这些增强的推理能力可能对解决科学、编码、数学和相似领域的复杂问题特别有用。例如,o1 可以被医疗保健研究人员用于注释细胞测序数据,被物理学家用于生成量子光学所需的复杂数学公式,以及被各领域的开发者用于构建和执行多步骤工作流程。
o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案,我们还发布了 [OpenAI o1-mini](https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/),这是一个更快、更便宜的推理模型,特别适合编码。作为一个较小的模型,o1-mini 比 o1-preview 便宜 80%,是需要推理但不需要广泛世界知识的应用的强大、经济高效的模型。
相似文章
经济学与 OpenAI o1 的推理能力
OpenAI 发布了 o1 模型系列,该模型具备扩展推理能力,通过在回应前花费更多时间思考,来解决科学、编码和数学领域的复杂问题。
使用 OpenAI o1 模型解决复杂问题
OpenAI 举办网络研讨会,展示其 o1 推理模型如何在编码、策略和研究领域解决复杂问题。
用 OpenAI o1 回答量子物理问题
OpenAI 发布了 o1 新型 AI 模型系列,该模型能在响应前花费更多时间进行推理,在处理复杂量子物理问题以及解决科学、编码和数学中的难题方面展现出显著能力。
使用 OpenAI o1 进行编码
OpenAI 发布了 o1 模型在编码任务中的功能和应用,强调了 AI 如何能够帮助开发者更持续、更规模化地构建应用。
OpenAI o1-mini
OpenAI 发布了 o1-mini,一款成本高效的推理模型,在数学和编码等 STEM 任务上与 o1 性能相当,但价格便宜 80%。该模型针对推理密集型应用进行了优化,现已向 API 用户和 ChatGPT Plus/Team/Enterprise/Edu 订阅者开放。