OpenAI o1 发布

OpenAI Blog 2024/09/12 10:03 模型

摘要

OpenAI 发布了 o1，一系列新的推理导向型 AI 模型，在科学、编码和数学等复杂任务上表现优于前代模型。预览版模型在国际数学奥林匹克竞赛问题上的解决率达到 83%，而 GPT-4o 仅为 13%，在竞技编程中达到第 89 个百分位。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:44

# 介绍 OpenAI o1 来源：https://openai.com/index/introducing-openai-o1-preview/ 我们开发了一系列新的 AI 模型，设计用于在回复前花费更多时间进行思考。它们能够推理复杂任务，并在科学、编码和数学方面比之前的模型解决更难的问题。今天，我们在 ChatGPT 和我们的 API 中发布了该系列的第一款。这是预览版，我们期望进行定期更新和改进。随着此次发布，我们还包括了[评估](https://openai.com/index/learning-to-reason-with-llms/)（用于下一次更新，目前正在开发中）。我们训练这些模型在回复前花费更多时间来思考问题，就像人类一样。通过训练，它们学会了优化思考过程、尝试不同的策略并识别自己的错误。在我们的测试中，下一个模型更新在物理、化学和生物学的具有挑战性的基准任务上的表现与博士生相当。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克（IMO）的资格考试中，GPT-4o 只正确解决了 13% 的问题，而推理模型获得了 83%。其编码能力在竞赛中进行了评估，在 Codeforces 竞赛中达到了第 89 百分位。您可以在我们的[技术研究文章](https://openai.com/index/learning-to-reason-with-llms/)中了解更多信息。作为早期模型，它还没有许多使 ChatGPT 有用的功能，例如网络浏览信息和上传文件和图像。对于许多常见情况，GPT-4o 在近期内将更加强大。但对于复杂的推理任务，这是一个重大进步，代表了 AI 能力的新水平。基于这一点，我们重置计数器回到 1，并将该系列命名为 OpenAI o1。这些增强的推理能力可能对解决科学、编码、数学和相似领域的复杂问题特别有用。例如，o1 可以被医疗保健研究人员用于注释细胞测序数据，被物理学家用于生成量子光学所需的复杂数学公式，以及被各领域的开发者用于构建和执行多步骤工作流程。 o1 系列在准确生成和调试复杂代码方面表现出色。为了为开发者提供更高效的解决方案，我们还发布了 [OpenAI o1-mini](https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/)，这是一个更快、更便宜的推理模型，特别适合编码。作为一个较小的模型，o1-mini 比 o1-preview 便宜 80%，是需要推理但不需要广泛世界知识的应用的强大、经济高效的模型。

OpenAI o1 发布

相似文章

经济学与 OpenAI o1 的推理能力

使用 OpenAI o1 模型解决复杂问题

用 OpenAI o1 回答量子物理问题

使用 OpenAI o1 进行编码

OpenAI o1-mini

提交意见反馈