ToolMol:用于多目标药物发现的进化式智能体框架

arXiv cs.LG 论文

摘要

ToolMol是一个进化式智能体框架,结合了多目标遗传算法和基于LLM的操作符,用于设计小分子药物,在多个蛋白质靶点上实现了最先进的结合亲和力和类药性。

arXiv:2605.12784v1 公告类型:新 摘要:大型语言模型(LLMs)的进展最近为小分子药物发现开辟了新的有前景的途径。然而,现有的基于LLM的分子生成方法常常遭受高比例的无效和低质量配体候选物,这是由于当前模型在分子字符串方面的语法限制。在本文中,我们介绍了$\texttt{ToolMol}$,一个用于从头药物设计的进化式智能体框架。$\texttt{ToolMol}$结合了多目标遗传算法和一个智能体LLM操作符,该操作符迭代地更新配体群体。我们构建了一个基于RDKit的全面工具函数库,使我们的智能体操作符能够一致地进行精确的配体修改。$\texttt{ToolMol}$在多目标属性优化任务上实现了最先进的性能,发现了具有类药性和可合成性的配体,在三个蛋白质靶点上的预测结合亲和力比现有方法强超过10%。此外,$\texttt{ToolMol}$配体在金标准绝对结合自由能分数上取得了最先进的结果,比现有方法提高了超过35%。通过研究思维链推理轨迹,我们观察到工具调用使模型能够更忠实地执行其计划的修改,有效利用LLMs中强大的化学先验知识。
查看原文
查看缓存全文

缓存时间: 2026/05/14 06:18

# ToolMol:面向多目标药物发现的进化智能体框架  
来源:https://arxiv.org/html/2605.12784  
Sharvaree Vadgama, Sumanth Varambally, Peter Eckmann, Michael K. Gilson, Rose Yu  

###### 摘要  

大语言模型(LLMs)的进展最近为小分子药物发现开辟了新的有前景的途径。然而,现有的基于LLM的分子生成方法常常产生大量无效和低质量的配体候选物,这是由于当前模型在分子字符串生成方面存在语法限制。本文介绍了一种用于从头药物设计的进化智能体框架**ToolMol**。ToolMol结合了多目标遗传算法和迭代更新配体种群的智能体LLM操作器。我们构建了一个全面的基于RDKit的工具箱,使智能体操作器能够持续进行精确的配体修饰。ToolMol在多目标性质优化任务上达到了最先进的性能,与现有方法相比,在三个蛋白质靶标上发现了预测结合亲和力强>10%的药物样且可合成的配体。此外,ToolMol配体在金标准绝对结合自由能分数上取得了最先进的结果,比现有方法提升超过35%。通过研究思维链推理痕迹,我们观察到工具调用使模型能够更忠实地执行其计划的修饰,有效利用了LLM中强大的化学先验知识。  

机器学习,ICML  

## 1 引言  

小分子药物发现是一个资源密集型过程,要求生成的化合物满足许多关键性质,历史上需要多轮湿实验试错。机器学习的进步催生了许多旨在解决此问题的生成方法。以往的工作主要集中在专门的生成模型上,例如VAEs(Eckmann et al., 2022, 2025)、扩散模型(Lee et al., 2023; Zhou et al., 2024; Joshi et al., 2025; Guan et al., 2024; Dorna et al., 2024)以及群等变扩散模型(Hoogeboom et al., 2022; Vadgama et al., 2026; Liu et al., 2025)。进化算法(Jensen, 2019)和贝叶斯优化算法(Zhu et al., 2023)等优化框架也被应用于此问题。然而,现有的生成方法通常不针对重要的分子性质,限制了它们生成同时具有良好结合亲和力、药物相似性和可合成性配体的能力(Crucitti et al., 2024)。  

大语言模型(LLMs)最近开始引起作为小分子生成方法的兴趣,显示出在生成强效、药物样配体方面的潜力(Wang et al., 2025)。与专门的生成模型不同,LLMs受益于大规模预训练,训练数据包括领域相关的科学文本,这赋予它们对优化任务以及化学研究实践和启发法(例如常见反应和先导化合物优化技术)的固有熟悉度(White, 2023)。大量与LLM相关的工作已经展示了当前LLM预测分子性质(Guo et al., 2023)和生成新型结构(Flam-Shepherd & Aspuru-Guzik, 2023)的能力。最近,MOLLEO(Wang et al., 2025)提出了一种遗传算法,直接将LLM作为变异和交叉操作器来生成分子后代,在生成具有期望性质的配体方面超越了众多专门的生成模型。  

然而,当前LLM的一个显著缺点是,即使提示它们仔细检查输出,它们也常常无法生成语法有效的分子字符串。我们观察到这种失败持续发生,平均而言,在超过30%的尝试分子生成中出现,即使在强推理模型(如GPT-OSS-120B(OpenAI et al., 2025))上也如此。这极大地阻碍了当前基于LLM的方法的进展。例如,MOLLEO在LLM操作器无法生成有效的SMILES结果时,会退回到基于非LLM的较弱的确定性交叉/变异操作器。我们认为,这种允许LLM直接输出分子字符串的方法并非利用LLM进行高效、基于性质的药物发现的理想方式。  

在这项工作中,我们引入了**ToolMol**,一种专注于从头小分子药物设计的新型药物发现算法。ToolMol结合了多目标遗传算法和一个智能体LLM操作器,该操作器使用一组确定性的、基于RDKit的工具迭代优化配体种群。ToolMol通过利用当前模型中高度优化的LLM工具调用功能,解决了无效分子生成的问题。ToolMol不是让LLM直接修改分子字符串编码,而是通过向LLM提供工具来抽象化这个过程,这些工具允许LLM仅提供其所需修饰的结构参数。这不仅大大减少了由LLM生成的无效SMILES字符串数量,而且还显著提高了生成配体的分子性质,包括预测结合亲和力、药物相似性和可合成性。我们将这项工作的贡献总结如下:  

- 我们提出了**ToolMol**,一种进化智能体药物发现框架,结合了多目标遗传算法和智能体LLM操作器,以持续生成语法有效且性质优化的分子。  
- 我们在三个蛋白质靶标上实现了多目标性质优化的最先进结果,预测结合亲和力增益超过先前方法的10%,并且对两个研究的靶标取得了最先进的绝对结合自由能分数,展示了LLM在从头药物设计中的实际效用。  
- 我们通过案例研究考察了我们框架的有效性,并观察到智能体工具调用过程显著提高了LLM推理轨迹与实际配体修饰之间的一致性。  

## 2 相关工作  

#### 用于分子设计的生成模型  
多种生成架构已被开发用于分子设计,每种都学习化学空间上的隐式分布,并利用外部oracle引导生成具有理想结合性质的分子。基于VAE的方法(如Eckmann et al., 2022; Jin et al., 2018; Eckmann et al., 2025; Gómez-Bombarelli et al., 2018)显示出前景,但通常不了解3D蛋白质结构。为了解决这个问题,DecompOpt(Zhou et al., 2024)和DecompDiff(Guan et al., 2024)是条件于蛋白质结构的扩散模型,并通过oracle和外部优化算法进一步引导向最优配体分子。Pocket2Mol(Peng et al., 2025)采用图神经网络,由多个编码器和预测器模块组成,基于现有配体原子和蛋白质口袋自回归地预测每个后续配体原子的位置和类型。PAFlow(Zhou et al., 2025)采用条件流匹配算法,由可学习的原子数预测器模型引导,生成更匹配结合口袋尺寸的分子。  

#### 多目标框架  
药物设计中的一个关键挑战是多目标优化,因为可行的药物候选物必须同时满足多个性质标准。TAGMol(Dorna et al., 2024)和DrugDiff(Oestreich et al., 2025)使用辅助引导模型影响采样过程中的Langevin动力学,从而生成满足多个性质标准的分子。Graph-GA(Jensen, 2019)采用进化算法,维护一个活跃分子种群,应用确定性交叉和变异规则逐步优化多个期望性质。OMTRA(Dunn et al., 2025)提出了一种用于基于结构的药物设计的模态灵活流匹配模型。HN-GFN(Zhu et al., 2023)利用多目标贝叶斯优化算法结合GFlowNet优化多个性质,包括分子多样性。  

#### 用于分子生成的LLMs  
LLM在药物发现中的应用目前仍然有限。当前方法处理通用化学任务(Bran et al., 2023; Boiko et al., 2023; Ma et al., 2024; Choi et al., 2026),或微调LLM以一次性设计强效结合物(Sheikholeslami et al., 2025)。利用LLM进行交叉/变异操作的遗传算法更适合性质优化任务,因为它们能够融入来自oracle的反馈。MOLLEO(Wang et al., 2025)代表了当前LLM引导药物生成的最先进水平,它通过用LLM驱动的结构修改替换算法交叉和变异来增强Graph-GA(Jensen, 2019),并在三个蛋白质靶标上取得了强大结果。作者展示了这些天生具有化学意识的LLM作为药物发现中竞争性生成方法的潜力。  

在生物化学中工具调用的相关前期工作包括El Agente Estructural(Choi et al., 2026),这是一个多模态框架,为LLM配备用于三维空间中分子的视觉和几何检查工具。然而,它设计用于人机交互而非融入优化循环。在这项工作中,我们设计了一个最小但有效的工具箱,提高了遗传算法中LLM建议的交叉和变异操作的质量。据我们所知,这是第一个在进化框架内利用LLM工具调用来优化药物发现分子性质的工作。  

(参见图注)  
图1:ToolMol概述。(a) 我们从ZINC 250K中采样初始配体种群。(b) 根据适应度概率对父配体进行交叉和变异采样。(c) 一个可访问一组修饰工具的智能体使用所选父结构生成新配体。(d) 新的后代由oracle对所有相关目标进行评估。(e) 从当前种群的非支配帕累托前沿形成新种群。重复步骤b→e直到达到oracle预算。  

## 3 ToolMol  

我们介绍ToolMol,一个智能体、多目标遗传算法框架,利用工具调用LLM对配体种群进行精确且引导的修饰。在本节中,我们首先介绍优化问题,然后描述包括ToolMol的遗传算法和工具调用过程。  

#### 问题陈述  
我们可以将分子优化问题广泛表示为  
M\* = argmax_{m ∈ M} Φ(m)  
其中m是任何有效分子(配体),M是整个有效化学空间。Φ是评估函数,给出m关于n个目标的适应度。该函数可以有多种定义方式;一种简单的方法是将候选物(成员的可行性或效用)的“适应度”视为所有目标的加权和,即Φ(m) = ∑ᵢ wᵢ * φᵢ(m),其中φᵢ是第i个目标评估器,wᵢ是该目标的权重¹。这些权重是任意的,在实践中难以选择。在这里,我们通过分子的偏序和帕累托前沿避免了进行这种任意选择的需要。形式上,我们可以通过记法m′ ≻ m来比较两个分子,这意味着m′严格支配m当且仅当∀i: φᵢ(m′) > φᵢ(m)。然后我们可以将最优集M\*定义为非支配帕累托前沿,由M\* = {m ∈ S: ∄m′, m′ ≻ m}给出,即所有不被其他分子支配的分子组成的集合。换句话说,M\*由所有这样的配体构成,没有其他配体在每一个目标上都严格胜过它。  

因为完整的化学空间M太大,难以充分探索,我们在M的一个有限子空间中搜索(实践中大致由随机初始种子确定),并旨在找到该子空间内的非支配帕累托前沿M\*。在这项工作中,我们考虑3个目标:m对特定蛋白质结合靶标的结合亲和力(ΔG,单位kcal/mol),通过Boltz-2(Passaro et al., 2025)估计;药物相似性的定量估计(Bickerton et al., 2012,QED);以及估计的合成可及性(Ertl & Schuffenhauer, 2009,SA)。这三个目标都是生成建模中的标准目标,QED和SA确保一定程度的配体结构合理性,估计结合亲和力衡量分子作为靶蛋白口袋结合物的实际效用。  

### 3.1 多目标遗传算法  

ToolMol算法的底层框架是多目标遗传算法(MOGA)。该过程的伪代码详述于算法1(参见图1的可视化指南)。我们从初始种群M₀开始,该种群从ZINC 250K(Sterling & Irwin, 2015)数据集中随机采样,

相似文章

The biggest AI breakthrough in medicine & drug discovery

Reddit r/singularity

MAML is a novel multi-modal AI model that unifies understanding of chemistry, genetics, and proteins, outperforming specialized models on 11 drug discovery benchmarks, promising to accelerate pharmaceutical research and improve success rates.

可控分子生成基础模型

arXiv cs.LG

提出CoMole,一种基于基序感知图扩散和强化学习的可控分子生成基础模型,在材料和药物发现基准测试中实现了卓越的可控性。