一种近乎自主的AI化学家改进了药物化学中的一个挑战性反应
摘要
OpenAI将GPT-5.4连接到自主化学AI(Maria)以改进伯磺酰胺的Chan-Lam偶联反应,在药物化学反应中实现了显著的产率提升。
OpenAI和Molecule.one展示了如何使用GPT-5.4的近乎自主AI化学家改进了一个关键的药物制造反应,推动了药物化学研究。
查看缓存全文
缓存时间: 2026/06/17 17:43
# 近乎自主的AI化学家改进药物化学中的一项挑战性反应
来源:https://openai.com/index/ai-chemist-improves-reaction/
OpenAI在科学领域的工作源于一个简单的信念:先进的人工智能可以成为科学家的强大伙伴,帮助他们探索更多想法,连接不同概念,设计更好的实验,并加速有益于人类的发现。我们已经分享了模型在数学领域做出新颖成果的早期例子,包括关于单位距离问题(https://openai.com/index/model-disproves-discrete-geometry-conjecture/)的工作;在理论物理方面,关于胶子振幅(https://openai.com/index/new-result-theoretical-physics/)的新成果;以及在生物学方面,GPT‑5帮助在自动化实验室中降低了无细胞蛋白质合成(https://openai.com/index/gpt-5-lowers-protein-synthesis-cost/)的成本。我们还推出了GPT‑Rosalind(https://openai.com/index/introducing-new-capabilities-to-gpt-rosalind/),一个专门构建的模型,用于支持生命科学研究和药物发现工作流程。
这个项目将这条轨迹延伸到药物化学领域,在这里进展不能仅靠推理来衡量。一个假设必须在实验室中,面对真实的分子、仪器和实验噪声,通过检验才能成立。我们与Molecule.one(在新窗口中打开)(https://molecule.one/)合作,将GPT‑5.4连接到Maria——一个与高通量实验室集成的自主化学AI,用于自主研究——并赋予它一个开放式的目标:改进几个重要反应类别之一。该系统生成了研究提案,设计并运行了实验,分析了实验数据,并提出了后续实验。人类通过设计引导和评估提示、选择要测试的提案,以及进行有限的实验计划修正、协助基本实验室操作和独立验证最终结果,始终处于循环中。
最有前景的提案OAI-M1-03专注于Chan-Lam偶联的一个困难但有用的版本,这是化学家用来形成碳-氮键的反应。从改进工艺化学中Chan-Lam偶联这个开放目标出发,GPT‑5.4独立识别出伯磺酰胺是一个具有挑战性、高价值的底物类别,并建议使用温和氧化剂(包括TEMPO)可以改善反应。
在Maria Lab的两个实验周期中,这个想法产生了显著的改进。在优化条件下,88%的测试硼酸和83%的测试磺酰胺的测量产率得到提高。平均产率从16.6%升至25.2%,产率超过30%的反应比例从15.6%增至37.5%。随后,人类化学家在台面规模重复了代表性反应。这些实验证实了微升级别的结果,显示14个底物对中有11个的产率更高,多数情况下提高了两倍以上。这一点很重要,因为药物化学家不仅需要反应在微升筛选实验中有效,还需要在药物发现过程中使用的实际实验室工作流程中也能起作用。
药物化学这一领域的改进尤其令人兴奋,因为合成通常是药物发现中的主要瓶颈:科学家只能测试他们能制造或以其他方式获得的分子。磺酰胺基团出现在涵盖广泛治疗领域的药物中,包括抗癌药、抗菌药和利尿剂,然而伯磺酰胺与硼酸的Chan-Lam偶联历史上产率一直很低。使这种形式的反应更可靠,可以为药物化学家提供更广泛、更实用的方法来生产和探索潜在有用的分子。
虽然这仍然是一个早期结果,但它为我们正在努力的更广泛方向提供了另一个具体例子:能够在研究循环的大部分环节中成为科学家宝贵伙伴的AI系统。该模型回顾了文献,提出了一个意想不到的想法,帮助设计和分析了实验,并得出了人类化学家可以评估的科学发现。
Maria Lab:Molecule.one的专业高通量实验室,在OAI-M1-03中运行了10,080个反应
## 为什么这个化学问题很重要
有机化学是所有小分子药物以及农业、电子和材料科学产品的基础。当一个反应能够可靠地跨多种不同起始材料形成同一种化学键时,它就特别有用。当反应产率低或产生过多不需要的副产物时,化学家可能不得不放弃原本有前景的分子,或者花费大量时间开发不同的路线。这使得合成成为药物发现中的主要瓶颈:科学家通常只能测试他们能制造或以其他方式获得的分子。
Chan-Lam偶联在药物化学中很有用,因为它能形成药物中常见的碳-氮键。然而,该反应并非对每一类分子都同样有效。特别是,伯磺酰胺与硼酸的偶联历史上产率一直很低。磺酰胺是一类重要的分子,存在于用于肿瘤学和传染病的药物中。使这个反应更可靠,可以为药物化学家提供更广泛、更实用的方法来生产和探索潜在有用的分子。
## 连接GPT‑5.4与Maria AI和实验室
这个组合系统将互补能力配对在一起。由与Maria AI合作的科学家编写的提示与GPT‑5.4在一个框架内一起使用,生成并对数千个可能的研究提案进行排名。人类化学家审查了根据系统排名最高的一小部分提案,并选择了四个进行实验室测试。然后,Maria AI将选定的高层次计划转化为详细的实验室指令,运行了数千个高通量实验,分析了原始数据,并将结构化结果返回给GPT‑5.4。
四个被选中的提案之一OAI-M1-03建议使用温和氧化剂(如TEMPO)来提高Chan-Lam反应在磺酰胺合成中的性能。化学家发现这个建议既令人惊讶又有趣。我们在这篇博文和论文(在新窗口中打开)(https://cdn.openai.com/pdf/4934b0ed-3de2-4ac5-835c-97604d52dea7/tempo-improves-generality-and-decreases-oxidative-deboronation.pdf)中分享了OAI-M1-03的详细发现。
然后,最后的研提案被Maria用于生成实验网格,人类做了轻微修正。最大的修正是在溶剂中避免使用二甲亚砜(DMSO),因为化学家担心它会与用作对比的更强氧化剂反应。
整个过程耗时三个月,从3月4日的第一次提示到6月4日将OAI-M1-03结果分享给独立专家。
我们将这个工作流程描述为近自主,而非完全自主,因为人类化学家在整个过程中仍然做出了重要决策。模型提出了关键的研究思路,而人类化学家提供了高层次指导和判断,纠正了实验细节,帮助准备了实验室耗材和试剂,并手动重复了关键实验。
## 我们的发现
OAI-M1-03发现TEMPO是所研究的伯磺酰胺Chan-Lam偶联的有用添加剂。在优化条件下,反应在两个方面得到改善:平均产率提高,更多底物组合达到了实际有用的产率。
在两个周期中,Maria总共运行了10,080个反应——这比一个化学家每天都进行三个反应,在十年内可能完成的还要多。这个规模很重要,因为当只对少数几个例子进行测试时,化学结果可能具有误导性。一个反应在一对起始材料上可能看起来有前景,但在更广泛的分子集合中却可能失败。数千个反应使得在测试的十种氧化剂中识别出TEMPO成为可能,看到效果在不同组合中重复出现,并发现了它的局限性。
在分析完第一轮数据后,系统提出了更集中的第二轮实验来测试后续假设。一个有用的后续发现是,TEMPO可以被一种更便宜的类似物4-羟基-TEMPO替代,而性能损失很小。
该结果在Maria Lab的微升级别筛选格式之外也成立。人类化学家手动在台面规模复制了代表性反应,观察到14个底物对中有11个产率提高;其中8个对的提高超过两倍。这种重复很重要,因为非常小规模的实验有时会引入伪影,而在更大规模下会消失。在科研期刊发表之前,进行台面规模验证也是惯例。
Molecule.one台面规模验证实验中的带标签玻璃反应瓶。
四位外部化学专家评审了描述OAI-M1-03的预印本。他们的评估支持我们的观点,即该结果是新颖的,值得与科学界分享。更严格的考验将来自下一步:独立实验室能否重复该结果,以及化学家是否发现它在更广泛的分子中有效。
在三个月期间由GPT‑5.4生成并由Maria测试的其他三个提案中,OAI-M1-02和OAI-M1-04在Maria Lab中得到了实验验证,而OAI-M1-01被证伪。对这些结果的分析仍在进行中。
## 局限性
这项工作表明,模型可以在有机化学中做出有用的贡献。它不仅仅是总结文献或提出一次性实验:它提出了一个具体的、令人惊讶的假设,并将其提交给人类评审,设计了实验,解释了实验数据,并设计了后续实验。
但这并不表明AI可以独立地从头到尾运行一个化学研究项目。人类的判断仍然至关重要,并且工作流程依赖于专门的高通量基础设施。这也不能证明该方法将推广到其他偶联反应、其他底物类别或生产条件。
产率估计来自高通量平台,台面验证涵盖了14个代表性底物对。还需要更多工作来表征反应机理,定义底物范围,测量不同实验室条件下的性能,并独立重复该结果。
## 准备工作
化学能力需要谨慎对待,因为同样的工具既可用于支持药物和材料科学,也可能被滥用。我们特意将这项研究的范围限定在一个合法的药物化学问题上:改进一种用于制造类药分子的已知偶联反应。实验不涉及毒素、化学武器或设计有害化合物的请求。这些结果不应被解读为该系统能够帮助那些有害应用的证据。该项目没有测试或展示这一点。
我们通过我们的准备工作框架(https://openai.com/index/updating-our-preparedness-framework/)评估和减轻先进模型能力带来的新兴风险,包括与化学和生物领域相关的风险。本工作中使用的模型已经接受了英国AI安全研究所的相关评估,并且该系统被设计为拒绝专注于有害应用的请求。实验工作流程增加了另一层控制:人类化学家选择哪些提案进入实验室,审查实验计划,并保留对物理基础设施的控制。
我们认为这是研究AI在实验化学领域潜力的负责任方式:选择一个具有明确科学价值的问题空间,将模型级别的安全措施与专家监督相结合,并通过受约束的物理实验评估系统。随着这些能力的提高,我们将继续评估新兴风险,加强安全措施,并具体说明一个结果意味着什么和不意味着什么。
## 下一步计划
接下来的直接步骤是科学性的:测试更广泛的起始材料,调查添加剂为何能改善反应,绘制效果起作用和失败的边界,并支持独立复制。这些研究将共同决定该方法可以有多广泛地应用,以及它在实际药物化学工作流程中有多大用处。
我们的长期目标是使AI系统成为可靠的科学伙伴,帮助研究人员提出假设、设计实验、解释结果并决定下一步测试什么,同时始终立足于专家判断、可靠测量和强有力安全措施。有机化学是一个尤其高杠杆的领域,因为小分子发现和制造的进展取决于能否可靠地制造分子。科学家只能测试他们能制造的分子,而更好的合成可以扩展他们在医学、农业、电子、能源和材料科学领域可以探索的思路范围。这个结果是这一更广泛方向的一个早期例子:一个前沿模型、专业智能体、一个自动化实验室和人类化学家共同合作,在研究循环中更快前进,并产生科学界可以评估、重复和在此基础上发展的发现。
我们感谢Molecule.one团队以及审阅这项工作的独立化学家。
相似文章
@OpenAI: GPT-5.4 帮助推动了一个药物化学项目,从文献综述到验证的实验结果。与…
GPT-5.4 与 Molecule.one 的 Maria AI 平台合作,自主推动了一个药物化学项目,从文献综述到验证的实验结果,提出了对药物发现中广泛应用的反应的意外改进。
@OpenAI:Maria 在 10,080 次反应中测试了这个想法,随后人类化学家手工验证了代表性结果。在……
OpenAI 与 Molecule.one 合作,让他们的 AI 系统(GPT-5.4 和 Maria)自主选择研究领域、生成提案并在有机化学中运行实验,实现了 88% 测试反应的产率提升——这是 AI 驱动的开放式科学发现的首次。
衡量AI加速生物学研究的能力
OpenAI展示了GPT-5通过与Red Queen Bio合作自主优化分子克隆方案的能力,通过新型酶机制实现了克隆效率79倍的提升。该工作展示了AI在湿实验室环境中支持实验迭代和实证验证的潜力,同时强调了生物安全考虑。
GPT-Rosalind 新增功能发布
OpenAI 推出了专为生命科学研究设计的更新版 GPT-Rosalind 模型,在药物化学、基因组学和药物发现流程方面性能提升,并引入了 LifeSciBench 和 MedChemBench 等新基准。
AI让化学家通过简单描述设计分子
EPFL的研究人员开发了Synthegy,一个利用大型语言模型通过自然语言指令指导化学逆合成和反应机理分析的AI框架,显著提升了化学家的战略规划能力。