一种近乎自主的AI化学家改进了药物化学中的一个挑战性反应

OpenAI Blog 2026/06/17 10:00 新闻

ai-chemist drug-discovery medicinal-chemistry autonomous-laboratory gpt-5-4 chan-lam-coupling openai

摘要

OpenAI将GPT-5.4连接到自主化学AI（Maria）以改进伯磺酰胺的Chan-Lam偶联反应，在药物化学反应中实现了显著的产率提升。

OpenAI和Molecule.one展示了如何使用GPT-5.4的近乎自主AI化学家改进了一个关键的药物制造反应，推动了药物化学研究。

查看原文

查看缓存全文

缓存时间: 2026/06/17 17:43

# 近乎自主的AI化学家改进药物化学中的一项挑战性反应来源：https://openai.com/index/ai-chemist-improves-reaction/ OpenAI在科学领域的工作源于一个简单的信念：先进的人工智能可以成为科学家的强大伙伴，帮助他们探索更多想法，连接不同概念，设计更好的实验，并加速有益于人类的发现。我们已经分享了模型在数学领域做出新颖成果的早期例子，包括关于单位距离问题（https://openai.com/index/model-disproves-discrete-geometry-conjecture/）的工作；在理论物理方面，关于胶子振幅（https://openai.com/index/new-result-theoretical-physics/）的新成果；以及在生物学方面，GPT‑5帮助在自动化实验室中降低了无细胞蛋白质合成（https://openai.com/index/gpt-5-lowers-protein-synthesis-cost/）的成本。我们还推出了GPT‑Rosalind（https://openai.com/index/introducing-new-capabilities-to-gpt-rosalind/），一个专门构建的模型，用于支持生命科学研究和药物发现工作流程。这个项目将这条轨迹延伸到药物化学领域，在这里进展不能仅靠推理来衡量。一个假设必须在实验室中，面对真实的分子、仪器和实验噪声，通过检验才能成立。我们与Molecule.one（在新窗口中打开）（https://molecule.one/）合作，将GPT‑5.4连接到Maria——一个与高通量实验室集成的自主化学AI，用于自主研究——并赋予它一个开放式的目标：改进几个重要反应类别之一。该系统生成了研究提案，设计并运行了实验，分析了实验数据，并提出了后续实验。人类通过设计引导和评估提示、选择要测试的提案，以及进行有限的实验计划修正、协助基本实验室操作和独立验证最终结果，始终处于循环中。最有前景的提案OAI-M1-03专注于Chan-Lam偶联的一个困难但有用的版本，这是化学家用来形成碳-氮键的反应。从改进工艺化学中Chan-Lam偶联这个开放目标出发，GPT‑5.4独立识别出伯磺酰胺是一个具有挑战性、高价值的底物类别，并建议使用温和氧化剂（包括TEMPO）可以改善反应。在Maria Lab的两个实验周期中，这个想法产生了显著的改进。在优化条件下，88%的测试硼酸和83%的测试磺酰胺的测量产率得到提高。平均产率从16.6%升至25.2%，产率超过30%的反应比例从15.6%增至37.5%。随后，人类化学家在台面规模重复了代表性反应。这些实验证实了微升级别的结果，显示14个底物对中有11个的产率更高，多数情况下提高了两倍以上。这一点很重要，因为药物化学家不仅需要反应在微升筛选实验中有效，还需要在药物发现过程中使用的实际实验室工作流程中也能起作用。药物化学这一领域的改进尤其令人兴奋，因为合成通常是药物发现中的主要瓶颈：科学家只能测试他们能制造或以其他方式获得的分子。磺酰胺基团出现在涵盖广泛治疗领域的药物中，包括抗癌药、抗菌药和利尿剂，然而伯磺酰胺与硼酸的Chan-Lam偶联历史上产率一直很低。使这种形式的反应更可靠，可以为药物化学家提供更广泛、更实用的方法来生产和探索潜在有用的分子。虽然这仍然是一个早期结果，但它为我们正在努力的更广泛方向提供了另一个具体例子：能够在研究循环的大部分环节中成为科学家宝贵伙伴的AI系统。该模型回顾了文献，提出了一个意想不到的想法，帮助设计和分析了实验，并得出了人类化学家可以评估的科学发现。 Maria Lab：Molecule.one的专业高通量实验室，在OAI-M1-03中运行了10,080个反应 ## 为什么这个化学问题很重要有机化学是所有小分子药物以及农业、电子和材料科学产品的基础。当一个反应能够可靠地跨多种不同起始材料形成同一种化学键时，它就特别有用。当反应产率低或产生过多不需要的副产物时，化学家可能不得不放弃原本有前景的分子，或者花费大量时间开发不同的路线。这使得合成成为药物发现中的主要瓶颈：科学家通常只能测试他们能制造或以其他方式获得的分子。 Chan-Lam偶联在药物化学中很有用，因为它能形成药物中常见的碳-氮键。然而，该反应并非对每一类分子都同样有效。特别是，伯磺酰胺与硼酸的偶联历史上产率一直很低。磺酰胺是一类重要的分子，存在于用于肿瘤学和传染病的药物中。使这个反应更可靠，可以为药物化学家提供更广泛、更实用的方法来生产和探索潜在有用的分子。 ## 连接GPT‑5.4与Maria AI和实验室这个组合系统将互补能力配对在一起。由与Maria AI合作的科学家编写的提示与GPT‑5.4在一个框架内一起使用，生成并对数千个可能的研究提案进行排名。人类化学家审查了根据系统排名最高的一小部分提案，并选择了四个进行实验室测试。然后，Maria AI将选定的高层次计划转化为详细的实验室指令，运行了数千个高通量实验，分析了原始数据，并将结构化结果返回给GPT‑5.4。四个被选中的提案之一OAI-M1-03建议使用温和氧化剂（如TEMPO）来提高Chan-Lam反应在磺酰胺合成中的性能。化学家发现这个建议既令人惊讶又有趣。我们在这篇博文和论文（在新窗口中打开）（https://cdn.openai.com/pdf/4934b0ed-3de2-4ac5-835c-97604d52dea7/tempo-improves-generality-and-decreases-oxidative-deboronation.pdf）中分享了OAI-M1-03的详细发现。然后，最后的研提案被Maria用于生成实验网格，人类做了轻微修正。最大的修正是在溶剂中避免使用二甲亚砜（DMSO），因为化学家担心它会与用作对比的更强氧化剂反应。整个过程耗时三个月，从3月4日的第一次提示到6月4日将OAI-M1-03结果分享给独立专家。我们将这个工作流程描述为近自主，而非完全自主，因为人类化学家在整个过程中仍然做出了重要决策。模型提出了关键的研究思路，而人类化学家提供了高层次指导和判断，纠正了实验细节，帮助准备了实验室耗材和试剂，并手动重复了关键实验。 ## 我们的发现 OAI-M1-03发现TEMPO是所研究的伯磺酰胺Chan-Lam偶联的有用添加剂。在优化条件下，反应在两个方面得到改善：平均产率提高，更多底物组合达到了实际有用的产率。在两个周期中，Maria总共运行了10,080个反应——这比一个化学家每天都进行三个反应，在十年内可能完成的还要多。这个规模很重要，因为当只对少数几个例子进行测试时，化学结果可能具有误导性。一个反应在一对起始材料上可能看起来有前景，但在更广泛的分子集合中却可能失败。数千个反应使得在测试的十种氧化剂中识别出TEMPO成为可能，看到效果在不同组合中重复出现，并发现了它的局限性。在分析完第一轮数据后，系统提出了更集中的第二轮实验来测试后续假设。一个有用的后续发现是，TEMPO可以被一种更便宜的类似物4-羟基-TEMPO替代，而性能损失很小。该结果在Maria Lab的微升级别筛选格式之外也成立。人类化学家手动在台面规模复制了代表性反应，观察到14个底物对中有11个产率提高；其中8个对的提高超过两倍。这种重复很重要，因为非常小规模的实验有时会引入伪影，而在更大规模下会消失。在科研期刊发表之前，进行台面规模验证也是惯例。 Molecule.one台面规模验证实验中的带标签玻璃反应瓶。四位外部化学专家评审了描述OAI-M1-03的预印本。他们的评估支持我们的观点，即该结果是新颖的，值得与科学界分享。更严格的考验将来自下一步：独立实验室能否重复该结果，以及化学家是否发现它在更广泛的分子中有效。在三个月期间由GPT‑5.4生成并由Maria测试的其他三个提案中，OAI-M1-02和OAI-M1-04在Maria Lab中得到了实验验证，而OAI-M1-01被证伪。对这些结果的分析仍在进行中。 ## 局限性这项工作表明，模型可以在有机化学中做出有用的贡献。它不仅仅是总结文献或提出一次性实验：它提出了一个具体的、令人惊讶的假设，并将其提交给人类评审，设计了实验，解释了实验数据，并设计了后续实验。但这并不表明AI可以独立地从头到尾运行一个化学研究项目。人类的判断仍然至关重要，并且工作流程依赖于专门的高通量基础设施。这也不能证明该方法将推广到其他偶联反应、其他底物类别或生产条件。产率估计来自高通量平台，台面验证涵盖了14个代表性底物对。还需要更多工作来表征反应机理，定义底物范围，测量不同实验室条件下的性能，并独立重复该结果。 ## 准备工作化学能力需要谨慎对待，因为同样的工具既可用于支持药物和材料科学，也可能被滥用。我们特意将这项研究的范围限定在一个合法的药物化学问题上：改进一种用于制造类药分子的已知偶联反应。实验不涉及毒素、化学武器或设计有害化合物的请求。这些结果不应被解读为该系统能够帮助那些有害应用的证据。该项目没有测试或展示这一点。我们通过我们的准备工作框架（https://openai.com/index/updating-our-preparedness-framework/）评估和减轻先进模型能力带来的新兴风险，包括与化学和生物领域相关的风险。本工作中使用的模型已经接受了英国AI安全研究所的相关评估，并且该系统被设计为拒绝专注于有害应用的请求。实验工作流程增加了另一层控制：人类化学家选择哪些提案进入实验室，审查实验计划，并保留对物理基础设施的控制。我们认为这是研究AI在实验化学领域潜力的负责任方式：选择一个具有明确科学价值的问题空间，将模型级别的安全措施与专家监督相结合，并通过受约束的物理实验评估系统。随着这些能力的提高，我们将继续评估新兴风险，加强安全措施，并具体说明一个结果意味着什么和不意味着什么。 ## 下一步计划接下来的直接步骤是科学性的：测试更广泛的起始材料，调查添加剂为何能改善反应，绘制效果起作用和失败的边界，并支持独立复制。这些研究将共同决定该方法可以有多广泛地应用，以及它在实际药物化学工作流程中有多大用处。我们的长期目标是使AI系统成为可靠的科学伙伴，帮助研究人员提出假设、设计实验、解释结果并决定下一步测试什么，同时始终立足于专家判断、可靠测量和强有力安全措施。有机化学是一个尤其高杠杆的领域，因为小分子发现和制造的进展取决于能否可靠地制造分子。科学家只能测试他们能制造的分子，而更好的合成可以扩展他们在医学、农业、电子、能源和材料科学领域可以探索的思路范围。这个结果是这一更广泛方向的一个早期例子：一个前沿模型、专业智能体、一个自动化实验室和人类化学家共同合作，在研究循环中更快前进，并产生科学界可以评估、重复和在此基础上发展的发现。我们感谢Molecule.one团队以及审阅这项工作的独立化学家。

一种近乎自主的AI化学家改进了药物化学中的一个挑战性反应

相似文章

@OpenAI: GPT-5.4 帮助推动了一个药物化学项目，从文献综述到验证的实验结果。与…

@OpenAI：Maria 在 10,080 次反应中测试了这个想法，随后人类化学家手工验证了代表性结果。在……

衡量AI加速生物学研究的能力

GPT-Rosalind 新增功能发布

AI让化学家通过简单描述设计分子

提交意见反馈