构建理解化学原理的AI模型

MIT News — Artificial Intelligence 新闻

摘要

MIT副教授Connor Coley讨论他开发AI模型以理解化学原理并通过预测反应路径和分析海量潜在化合物来加速药物发现的工作。

<p>在所有可能的化合物中,据估计约有10<sup>20&nbsp;</sup>到10<sup>60&nbsp;</sup>种可能作为小分子药物具有潜力。</p><p>对化学家来说,通过实验评估每一种化合物将过于耗时。因此,近年来研究人员开始使用人工智能来帮助识别可能成为良好候选药物的化合物。&nbsp;</p><p>其中一位研究人员是MIT副教授Connor Coley(2019届博士),他是1957届职业发展副教授,同时在化学工程系、电气工程与计算机科学系以及MIT苏世民计算机学院任职。他的研究横跨化学工程与计算机科学,开发和部署计算模型以分析海量可能的化合物、设计新化合物以及预测可生成这些化合物的反应路径。&nbsp;</p><p>“这是一种非常通用的方法,可应用于有机分子的任何应用,但我们考虑的主要应用是小分子药物发现,”他说。</p><p><strong>AI与科学的交叉</strong></p><p>Coley对科学的兴趣源于家族。他说,他的家庭成员中科学家多于非科学家,包括他的父亲(放射科医生)、母亲(在进入MIT斯隆管理学院之前获得了分子生物物理与生物化学学位)以及祖母(数学教授)。</p><p>在俄亥俄州都柏林读高中时,Coley参加了科学奥林匹克竞赛,并在16岁时高中毕业。随后他前往加州理工学院,选择化学工程作为专业,因为这提供了一种结合他对科学和数学兴趣的方式。</p><p>在本科期间,他还追求了对计算机科学的兴趣,在一个结构生物学实验室使用Fortran编程语言帮助解析蛋白质晶体结构。从加州理工学院毕业后,他决定继续攻读化学工程,并于2014年来到MIT开始博士研究。</p><p>在Klavs Jensen和William Green教授的指导下,Coley致力于优化自动化化学反应的方法。他的工作重点是结合机器学习和化学信息学(应用计算方法分析化学数据)来规划可生成新药物分子的反应路径。他还致力于设计可用于自动执行这些反应的硬件。&nbsp;</p><p>部分工作是通过DARPA资助的名为Make-It的项目完成的,该项目专注于利用机器学习和数据科学改进从简单构建块合成药物和其他有用化合物的方法。</p><p>“那是我真正开始思考化学信息学、机器学习以及如何利用模型理解不同化学品的制造方法和可能反应的切入点,”Coley说。</p><p>Coley在研究生期间就开始申请教职,并在25岁时接受了MIT的职位。他收到了各种建议,有人支持也有人反对在同一所研究生院校工作,最终他认为MIT的职位太有吸引力而无法拒绝。</p><p>“MIT在资源和跨部门流动性方面是一个非常特殊的地方。MIT似乎在支持AI与科学的交叉方面做得非常好,并且是一个充满活力的生态系统,值得留下来,”他说。“学生的素质、热情以及令人难以置信的合作优势,绝对超过了留在原地的任何潜在顾虑。”</p><p><strong>化学直觉</strong></p><p>Coley将教职推迟了一年,前往博德研究所做博士后,以获取更多化学生物学和药物发现方面的经验。在那里,他致力于从DNA编码文库中数十亿候选分子中识别可能与疾病相关突变蛋白具有结合相互作用的小分子。</p><p>2020年回到MIT后,他建立了自己的实验室团队,使命是部署AI不仅合成具有治疗潜力的现有化合物,还设计具有理想特性的新分子及其制造新方法。过去几年中,他的实验室开发了多种计算方法来实现这些目标。&nbsp;</p><p>“我们试图思考如何将化学挑战与潜在的计算解决方案最佳地配对。这种配对常常推动新方法的开发,”Coley说。他的实验室开发的一个名为ShEPhERD的模型,经过训练可根据药物分子的三维形状评估它们与靶蛋白的相互作用方式。该模型现在已被制药公司用于帮助发现新药。&nbsp;</p><p>“我们试图给予生成模型更多的药物化学直觉,使模型意识到正确的标准和考虑因素,”Coley说。</p><p>在另一个项目中,Coley的实验室开发了一个名为<a href="https://news.mit.edu/2025/generative-ai-approach-to-predicting-chemical-reactions-0903" target="_blank">FlowER</a>的生成式AI模型,可用于预测不同化学输入组合后产生的反应产物。&nbsp;</p><p>在设计该模型时,研究人员内置了对基本物理原理(如质量守恒定律)的理解。他们还迫使模型考虑从反应物到产物的路径中中间步骤的可行性。研究人员发现,这些约束提高了模型预测的准确性。</p><p>“思考这些中间步骤、涉及的机制以及反应如何演变,是化学家非常自然做的事情。这是化学教学的方式,但并非模型天生会考虑的事情,”Coley说。“我们花了大量时间思考如何确保我们的机器学习模型基于对反应机制的理解,就像专家化学家那样。”</p><p>他实验室的学生还研究许多与化学反应优化相关的不同领域,包括计算机辅助结构解析、实验室自动化和最优实验设计。</p><p>“通过这些众多不同的研究方向,我们希望推进AI在化学领域的前沿,”Coley说。</p>
查看原文
查看缓存全文

缓存时间: 2026/05/20 12:22

# 构建理解化学原理的AI模型 来源:https://news.mit.edu/2026/building-ai-models-with-chemical-principles-connor-coley-0520 在所有可能的化合物中,据估计约有10^20到10^60种可能具有小分子药物的潜力。 对每一种化合物进行实验评估对化学家而言过于耗时。因此,近年来,研究人员开始利用人工智能来帮助识别可能成为良好药物候选的化合物。 其中一位研究人员是MIT副教授Connor Coley(2019年博士),他是1957届职业发展副教授,在化学工程系、电气工程与计算机科学系以及MIT施瓦茨曼计算学院联合任职。他的研究横跨化学工程与计算机科学,开发并部署计算模型,用于分析海量可能的化合物、设计新化合物,并预测能够生成这些化合物的反应路径。 “这是一种非常通用的方法,可应用于有机分子的任何应用场景,但我们主要考虑的是小分子药物发现,”他表示。 **AI与科学的交叉点** Coley对科学的兴趣源于家庭影响。事实上,他说,他们家科学家比非科学家还多,包括他父亲(放射科医生)、母亲(在进入MIT斯隆管理学院前获得分子生物物理学与生物化学学位)以及祖母(数学教授)。 在俄亥俄州都柏林读高中时,Coley参加了科学奥林匹克竞赛,并在16岁高中毕业。之后他进入加州理工学院,选择化学工程作为专业,因为这能结合他在科学和数学方面的兴趣。 本科期间,他还对计算机科学产生了兴趣,在一个结构生物学实验室使用Fortran编程语言帮助解析蛋白质的晶体结构。从加州理工学院毕业后,他决定继续深耕化学工程,并于2014年来到MIT攻读博士学位。 在教授Klavs Jensen和William Green的指导下,Coley致力于优化自动化学反应的方法。他的研究重点是结合机器学习和化学信息学(应用计算方法分析化学数据)来规划能够制造新药物分子的反应路径。他还设计了用于自动执行这些反应的硬件设备。 其中部分工作通过DARPA资助的“Make-It”项目完成,该项目专注于利用机器学习和数据科学,从简单构建块改进药物及其他有用化合物的合成。 “这是我真的进入化学信息学、机器学习以及思考如何利用模型理解不同化学品如何制造以及哪些反应可能的切入点,”Coley说。 Coley在研究生阶段就开始申请教职,并在25岁时接受了MIT的offer。他收到了关于是否应在同一所学校(他读研的地方)任职的各种建议,最终决定MIT的职位太有吸引力,难以拒绝。 “MIT是一个资源丰富且跨部门流动顺畅的特殊地方。MIT在支持AI与科学的交叉点上做得非常好,这是一个充满活力的生态系统,值得留下来,”他说。“学生的素质、学生的热情以及合作的强大力量,绝对超过了对留在同一个地方可能存在的任何担忧。” **化学直觉** Coley将教职推迟了一年,在Broad Institute做博士后,以在化学生物学和药物发现方面积累更多经验。在那里,他致力于从DNA编码文库中的数十亿候选物中识别可能与疾病相关突变蛋白结合的小分子。 2020年回到MIT后,他组建了自己的实验室,使命不仅是利用AI合成具有治疗潜力的现有化合物,还设计具有理想性质的新分子及其新制造方法。过去几年中,他的实验室开发了多种计算方法来实现这些目标。 “我们试图思考如何最好地将化学挑战与潜在的计算解决方案配对。这种配对往往推动新方法的发展,”Coley说。他实验室开发的一个名为ShEPhERD的模型,通过训练根据药物分子的三维形状评估潜在新药分子与目标蛋白的相互作用方式。目前制药公司正在使用该模型帮助发现新药。 “我们试图让生成模型具备更多药物化学直觉,使模型意识到正确的标准和考量,”Coley说。 在另一个项目中,Coley的实验室开发了一个名为FlowER的生成式AI模型,可用于预测不同化学输入组合后的反应产物。 在设计该模型时,研究人员内置了对基本物理原理(如质量守恒定律)的理解。他们还迫使模型考虑从反应物到产物路径上中间步骤的可行性。研究人员发现,这些约束提高了模型预测的准确性。 “思考这些中间步骤、涉及的反应机理以及反应如何演化,是化学家非常自然的事情。这是化学的教学方式,但模型本身不会考虑这些,”Coley说。“我们花了很多时间思考如何确保我们的机器学习模型基于对反应机理的理解,就像专家化学家所做的。” 他实验室的学生还从事许多与化学反应优化相关的不同领域,包括计算机辅助结构解析、实验室自动化和最优实验设计。 “通过这些不同的研究线索,我们希望推动AI在化学领域的前沿,”Coley说。

相似文章

AI让化学家通过简单描述设计分子

Reddit r/singularity

EPFL的研究人员开发了Synthegy,一个利用大型语言模型通过自然语言指令指导化学逆合成和反应机理分析的AI框架,显著提升了化学家的战略规划能力。

The biggest AI breakthrough in medicine & drug discovery

Reddit r/singularity

MAML is a novel multi-modal AI model that unifies understanding of chemistry, genetics, and proteins, outperforming specialized models on 11 drug discovery benchmarks, promising to accelerate pharmaceutical research and improve success rates.

新AI工具可生成数百万种新分子

Reddit r/ArtificialInteligence

来自罗维拉-威尔吉利大学的研究人员在《自然-机器智能》上发表论文,介绍了CoCoGraph,这是一种利用约束离散扩散过程生成化学有效的新型分子的AI工具。