用GPT-5加速科学研究的早期实验
摘要
OpenAI发布了一篇研究论文,记录了GPT-5在数学、物理、生物学等多个领域加速科学发现的早期实验成果,包括该模型帮助识别疾病机制、解决开放性问题以及与领先大学和国家实验室合作改进优化算法的案例。
OpenAI展示了首批研究案例,证明GPT-5如何在数学、物理、生物学和计算机科学等领域加速科学进展。探索AI与研究人员如何协作来生成证明、发现新的洞见,以及重塑发现的步伐。
查看缓存全文
缓存时间:
2026/04/20 14:52
# 利用 GPT-5 加速科学的早期实验
来源:https://openai.com/index/accelerating-science-gpt-5/
科学塑造了从人类健康到能源生产、从国家安全到对宇宙的理解等一切领域。如果AI能加速科学——缩短产生新想法的时间,或从想法到经过测试的结果的时间——其效益将在整个社会中产生复利效应。
但创新的步伐仍然是一个制约因素。即使正确的想法已经存在,将其转化为产品或治疗方法也需要数年时间。在最近的一项调查中,60% 的美国人表示科学和医学突破传播给他们的速度太慢;73% 的人表示我们需要更好的方式来加速发现;69% 的人将科学领导力列为首要国家优先事项。
今天,我们发布了《利用 GPT-5 进行早期科学加速实验》论文,该论文由来自范德堡大学、加州大学伯克利分校、哥伦比亚大学、牛津大学、剑桥大学、劳伦斯利弗莫尔国家实验室和杰克逊实验室的合作者共同撰写。该论文汇编了数学、物理学、生物学、计算机科学、天文学和材料科学领域的早期案例研究,其中 GPT-5 帮助研究人员以新颖的方式综合已知结果、进行强大的文献审查、加速艰难的计算,甚至生成未解命题的新颖证明。该论文还记录了局限性。我们的目标是让社区清楚地了解这些系统在研究环境中目前能做什么和不能做什么。
这些案例研究展示了 GPT-5 如何在专家手中加速科学发现,以及这种加速为什么重要:
- **生物学**:在医学博士 Derya Unutmaz 领导的研究中,科学家们花费数月时间试图解释人类免疫细胞中的一个令人费解的变化。GPT-5 在几分钟内从未发表的图表中识别了可能的机制,并建议了一个验证它的实验。这种速度可以帮助研究人员更快地理解疾病并开发更好的治疗方法。
- **数学**:在另一个案例中,研究人员 Mehtaab Sawhney 和 Mark Sellke 正在解决由 Paul Erdős 最初提出的几十年来的开放问题。他们卡在了最后一步,GPT-5 提供了一个新想法,说明一个奇数如何打破了这个模式,这帮助他们完成了证明。这样的进展加强了许多算法和安全技术最终所依赖的数学基础。
- **算法与优化**:研究人员 Sébastien Bubeck 和 Christian Coester 正在测试机器人技术和路由中使用的常见决策方法是否像人们认为的那样可靠。GPT-5 找到了一个新的、清晰的例子,表明该方法可能失败,并改进了优化领域的一个经典结果,这是用来找出解决问题的最佳方式的数学。这类进展帮助工程师更好地理解用于机器人、路由和其他实际应用中的决策系统。
OpenAI for Science 的使命是加速科学发现:帮助研究人员探索更多想法、更快地检验假设,以及发现否则需要大量时间才能发现的见解。我们通过将前沿模型与正确的工具、工作流程和合作配对来实现这一目标。
我们与学术界、工业界和国家实验室的研究人员密切合作。这些合作帮助我们了解模型在哪里有用、在哪里失败,以及如何将其整合到科学过程中——从文献审查和证明生成到建模、模拟和实验设计。
我们的方法结合了两个相辅相成的信念。专门的科学工具,如模拟引擎、蛋白质数据库和计算机代数系统,对效率和精度至关重要。同时,扩展基础模型继续解锁新的推理能力:跨领域连接想法、勾勒证明、提议机制以及在概念上而不是通过关键词导航大量文献。在存在专门工具的地方,我们想使用它们;在需要通用推理的地方,我们构建旨在处理它的模型。两条路径相辅相成。
最有意义的进展来自人-AI 团队。科学家设定议程:定义问题、选择方法、批评想法并验证结果。GPT-5 提供广度、速度和并行探索多个方向的能力。
有效使用 GPT-5 是一项技能。研究人员学习如何提出问题、何时反驳、如何将问题分解成步骤,以及验证什么。生产性工作通常看起来像对话——研究人员和模型迭代,直到出现有前景的方向或想法被放弃。
在这些早期研究中,当由专家使用时,GPT-5 似乎能够缩短研究工作流程的部分内容。它不能自主运行项目或解决科学问题,但它可以扩大探索的范围,并帮助研究人员更快地朝着正确的结果迈进。
- 一个新兴能力是概念文献搜索。GPT-5 通常能识别想法之间更深层的关系,并检索来自不同语言和难以获取的来源的相关材料。研究人员报告发现了他们之前不知道的参考文献、联系和论文。
- 在数学和理论计算机科学中,其中结构是明确的且反馈循环很快,GPT-5 特别有帮助。数学家已使用 GPT-5 在几分钟内生成可行的证明大纲,转变原本可能需要数天或数周的工作。在物理学和计算领域,该模型可以提议简化变换或指出其他领域中的类似结构。
- 在生物学和其他经验科学中,该模型可以提议机制并设计实验来验证这些在湿实验室中的假设。
我们已经超越了模型仅总结现有知识的阶段。现在,GPT-5 的早期贡献可以在专家监督下有意义地协助研究人员。改进的步伐表明随着能力和工具的进步,有更深层加速的潜力。
这些案例研究是 GPT-5 有用的精选插图;它们不是系统样本,也不能捕捉失败模式的全部范围。专家监督仍然至关重要。GPT-5 有时可能会产生看起来似是而非的虚假引用、机制或证明;它对脚手架和热身问题很敏感;它有时会忽视特定领域的微妙之处;如果不更正,它可能会遵循无生产力的推理线。这些是活跃的研究领域,我们正与合作者合作,在完善未来系统时测量和减轻这些失败。
总的来说,这些早期研究表明 GPT-5 开始帮助进行新型科学工作。该模型不是自主的,但在专家手中,它可以帮助证明定理、重新发现和扩展结构、浮现跨领域联系,以及为科学家生成和验证机制和实验。
我们也看到了这些系统随着更多时间和计算而改进的轨迹。如果 GPT-5 能在 20 分钟内有意义地协助某些研究问题,我们预期当模型能花费数小时或数天时间对问题进行推理时会产生更深层的结果。结合世界一流的科学家,这指向了随时间推移科学生产力可能发生阶跃变化的可能性。
相似文章
OpenAI Blog
OpenAI宣布将GPT-5应用于医学研究,突出展示该模型在医疗健康和科学发现领域的能力。
OpenAI Blog
OpenAI发布了GPT-5.2,包括专门针对科学和数学工作优化的GPT-5.2 Pro与GPT-5.2 Thinking变体。该模型在GPQA Diamond(93.2%)和FrontierMath(40.3%)等基准测试中达到了最先进的性能,展现出更强的推理能力,旨在加速物理、化学、生物和数学等领域的科学研究。
OpenAI Blog
OpenAI推出FrontierScience,这是一个新的基准测试,用于衡量人工智能在物理、化学和生物学领域的专家级科学能力。GPT-5.2在奥林匹克式任务中达到77%,在研究型任务中达到25%。该论文提供了早期证据,表明GPT-5能显著加速真实的科学工作流程,将工作周期从数周缩短至数小时,同时建立了度量标准,以追踪朝着AI加速科学研究的进展。
OpenAI Blog
OpenAI 推出 GPT-5,这是 AI 智能的重大飞跃,在代码编写、数学、写作、健康和视觉感知等方面展现了最先进的性能。这个统一系统包括一个高效的智能模型、一个深度推理模型(GPT-5 thinking)和一个实时路由器,用于最优响应选择。
OpenAI Blog
OpenAI 发布了 GPT-5.5,这是其前沿 AI 模型的重大升级,在保持高效与速度的同时,在智能体编码、研究以及多步骤任务执行等方面具备更强的能力。