Pepti-drift：抗原条件性离散肽生成的毒性排斥漂移方法

arXiv cs.LG 2026/06/29 04:00 论文

摘要

Pepti-drift 是一种毒性感知的潜在空间精炼框架，用于生成抗原特异性肽，在保持结合亲和力的同时避免毒性。与现有方法相比，它实现了大幅加速，并产生了多样、有效且低毒性的肽候选物。

arXiv:2606.27824v1 公告类型：新摘要：肽是一种有前景的治疗模式，结合了小分子的化学可调性和大分子治疗药物的靶点特异性。然而，设计抗原特异性结合肽同时避免毒性，仍然是治疗性肽发现的主要挑战。在此，我们提出 Pepti-drift，一种毒性感知的潜在空间精炼框架，通过单次抗原条件性漂移步骤生成肽候选物。在肽嵌入空间中，Pepti-drift 学习将生成的肽潜在向量吸引到抗原匹配的结合肽，同时将其从毒性相关区域排斥。这具有挑战性，因为促进结合的理论化学特征往往与肽表示空间中的毒性相关特征重叠。为了解决这一问题，我们引入了一种预热策略，通过首先学习面向结合的吸引，然后增加毒性排斥，来稳定这一竞争性目标。

查看原文

查看缓存全文

缓存时间: 2026/06/29 05:26

# Pepti-drift：抗原条件性离散肽生成的毒性排斥漂移
来源：https://arxiv.org/html/2606.27824
Takashi Fujiwara Department of AI Systems Medicine Institute of Integrated Research Institute of Science Tokyo, SB Intuitions Tokyo, JAPAN takashi\.fujiwara@sbintuitions\.co\.jp &Hikaru Shindo SB Intuitions Tokyo, JAPAN hikaru\.shindo@sbintuitions\.co\.jp &Kaushalya Madhawa SB Intuitions Tokyo, JAPAN kaushalya\.madhawa@sbintuitions\.co\.jp &Jun Jin Choong SB Intuitions Tokyo, JAPAN jun\-jin\.choong@sbintuitions\.co\.jp &Keisuke Ozawa SB Intuitions Tokyo, JAPAN keisuke\.ozawa@sbintuitions\.co\.jp

###### 摘要

多肽是一种有前景的治疗方式，它结合了小分子的化学可调性和大分子治疗药物的靶点特异性。然而，在设计抗原特异性结合肽的同时避免毒性，仍然是治疗性多肽发现的主要挑战。本文提出 Pepti-drift，一种毒性感知的潜在空间细化框架，通过单步抗原条件漂移生成多肽候选物。在多肽嵌入空间中，Pepti-drift 学会将生成的多肽潜在表示吸引向抗原匹配的结合肽，同时将其从毒性相关区域排斥开。这具有挑战性，因为促进结合的物理化学特征往往与多肽表示空间中的毒性特征重叠。为了解决这一问题，我们引入一种预热策略，通过先学习结合导向的吸引，再逐步增加毒性排斥，来稳定这一竞争性目标。Pepti-drift 实现了高效生成，运行速度比 PepMLM 快 16.2 倍，比 PepTune 快 1,092.0 倍。生成的多肽显示出 100% 的有效性、98.1% 的唯一性、最高的序列多样性，以及近乎为零的交叉抗原复用。进一步评估表明，在大多数肽长范围内，目标相关的预测结合信号得以保留，同时毒性风险和溶血风险持续降低。因此，Pepti-drift 为抗原特异性多肽设计提供了一个快速、可扩展且可控的框架，直接编码了安全且有效的特性。

*关键词* 治疗性多肽设计⋅\\cdot抗原条件性多肽生成⋅\\cdot漂移模型⋅\\cdot毒性感知生成⋅\\cdot避免溶血

## 1 引言

多肽是短氨基酸序列，能够结合特定靶标蛋白并调节其功能，使其成为药物设计的有前景候选。作为一种治疗方式，它们占据了小分子和抗体之间的有吸引力的空间，结合了合成可及性和化学可调性，以及高特异性结合蛋白表面的能力。然而，可能的多肽序列空间随长度呈指数增长，远超实验筛选所能探索的范围。生成模型通过学习从可能包含功能候选物的序列区域直接采样，提供了另一种选择。蛋白质语言模型的最新进展 (Linet al.,2023 (https://arxiv.org/html/2606.27824#bib.bib4)) 进一步实现了捕获进化、结构和功能信息的序列级表示，使得将多肽生成条件化于靶标蛋白序列变得日益可行。然而，在治疗场景中，生成必须是*条件性的*：不同的靶标蛋白需要不同的结合肽，生成器必须为每个靶标生成特异性候选物，而不是从通用的多肽分布中采样。此外，仅生成结合序列是不够的。一个实际有用的生成器必须生成不仅与靶标兼容，而且有效、多样、抗原特异且兼容下游开发需求的候选物，即学习不仅*要生成什么*，还要*避免什么*。

使这个问题特别困难的是，与强结合相关的序列特征和与毒性相关的特征并非独立。许多多肽通过其物理化学性质（如高正电荷和对脂质膜的亲和力）与靶标相互作用。然而，这些相同的性质会导致多肽非选择性地破坏细胞膜，损害健康细胞（细胞毒性）或破坏红细胞（溶血）。例如，设计用于结合并破坏细菌膜的多肽也可以通过相同的生物物理机制溶解人类红细胞 (Hancock and Sahl,2006 (https://arxiv.org/html/2606.27824#bib.bib19); Fjellet al.,2012 (https://arxiv.org/html/2606.27824#bib.bib20))。这种耦合意味着，在任何学习到的嵌入空间中，结合肽和毒性肽并非完全分离；它们占据重叠区域，因为共享的潜在序列特征使它们在表示空间中相邻（图1 (https://arxiv.org/html/2606.27824#S1.F1)，左）。因此，仅优化靶标结合的生成器往往会产生落在这个重叠区域的候选物，生成结合良好但带有安全风险的序列。

参考图注图 1：Pepti-drift 解决了多肽空间中结合与毒性的重叠。（左）促进靶标结合的序列特征也会增加毒性风险，导致两个多肽群体在表示空间中重叠。仅优化结合的生成器会落入这个重叠区域。（右）Pepti-drift 通过两种相反的力引导生成的多肽来解决这一问题：吸引朝向结合分布，排斥远离毒性分布，将候选物移动至安全且有效的区域。现有的大多数肽生成方法仅部分解决了这种结合-毒性的权衡。PepMLM (Chenet al.,2025 (https://arxiv.org/html/2606.27824#bib.bib1)) 将靶标条件性多肽设计公式化为掩码序列重建，其中靶标蛋白序列与掩码肽区域连接，微调后的 ESM-2 (Linet al.,2023 (https://arxiv.org/html/2606.27824#bib.bib4)) 模型学习以靶标为条件恢复多肽。PepMLM 可以生成与靶标兼容的多肽，但其监督信号仅来自阳性结合示例。因此，学习到的分布倾向于向结合相关区域移动，而没有明确的反信号阻止样本进入附近的毒性相关区域。PepTune (Tanget al.,2025 (https://arxiv.org/html/2606.27824#bib.bib2)) 通过将离散扩散与蒙特卡洛树引导 (MCTG) 相结合，在推理过程中优化包括结合亲和力、溶解性和溶血在内的多个性质，更直接地解决了安全性和可开发性问题。这是向属性感知多肽生成迈出的重要一步。然而，安全性控制是通过迭代的奖励引导采样施加的，而不是作为学习到的生成器的内在几何偏差进行编码。此外，重复的树引导去噪过程引入了大量计算成本，这在筛选许多抗原或生成大型候选库时可能限制可扩展性。因此，当前方法仍受限于高效靶标条件生成和明确安全控制之间的权衡。我们需要的是一个可扩展的框架，将毒性编码为生成过程中应避免的多肽空间负区域。

为了解决这些局限性，我们提出 Pepti-drift，一种单步潜在空间细化框架，明确编码了生成的多肽应该移向何处以及不应移向何处。Pepti-drift 使用冻结的蛋白质语言模型（ESM-2）将抗原和多肽序列映射到共享的归一化嵌入空间中。抗原条件生成器从高斯噪声产生初始多肽潜在表示z0z\_\{0\}，然后一个学习到的漂移模块（基于漂移模型 (Denget al.,2026 (https://arxiv.org/html/2606.27824#bib.bib3)) 的单步细化原理，该模型来自流匹配家族 (Lipmanet al.,2023 (https://arxiv.org/html/2606.27824#bib.bib5); Liuet al.,2023 (https://arxiv.org/html/2606.27824#bib.bib6)) 的新兴生成范式）在单步中进行细化。漂移遵循一个具有两个分量的向量场：一个吸引项将z0z\_\{0\}拉向抗原匹配的结合多肽潜在表示，另一个排斥项将其推离毒性相关的多肽区域（图1 (https://arxiv.org/html/2606.27824#S1.F1)，右）。与需要多个去噪步骤或重复预测器评估的迭代方法不同，这种细化是一个单一的学习更新，使得从抗原嵌入到多肽序列的整个流程只需一次前向评估。漂移后的潜在表示z1z\_\{1\}由非自回归 Transformer (Guet al.,2018 (https://arxiv.org/html/2606.27824#bib.bib12)) 解码成多肽序列，该 Transformer 并行预测所有位置，实现单步序列生成。由于结合分布和毒性分布之间的重叠正是导致问题困难的原因，漂移公式从几何上解决这一问题：向量场的构造使得生成的潜在表示移向结合分布中不与毒性重叠的部分。尽管无分类器引导 (Ho and Salimans,2021 (https://arxiv.org/html/2606.27824#bib.bib8)) 和负引导 (Koulischeret al.,2025 (https://arxiv.org/html/2606.27824#bib.bib9)) 已被探索用于将扩散模型引向或远离目标分布，但 Pepti-drift 将两种信号都集成到单一学习到的漂移步骤中，而不是在推理时修改采样过程。一个关键的训练挑战源于同样的重叠：在训练早期，吸引和排斥信号可以在模型学习到稳定的潜在结构之前产生竞争梯度。我们通过一个预热计划来解决这个问题：首先训练漂移模块移向结合肽，然后在结合导向的轨迹稳定后逐步引入来自毒性肽的排斥信号。

在抗原级分拆控制的基准测试中，与现有方法相比，Pepti-drift 生成有效、多样且抗原特异的多肽候选物，同时降低了预测的毒性和溶血风险。该模型实现比 PepMLM 快16×16\\times的端到端生成，比 PepTune 快超过1,000×1\{,\}000\\times的生成，同时保持预测的结合倾向并将交叉抗原复用降至接近零。我们的主要贡献是：

1. 1.一种潜在漂移框架，通过将学习到的向量场分解为吸引（结合）和排斥（毒性）分量，在单步中生成与靶标兼容且安全感知的多肽。
2. 2.一种预热负排斥策略，通过先学习吸引再逐步引入排斥，在目标分布和回避分布重叠时稳定训练。
3. 3.实验结果表明，Pepti-drift 生成有效、多样且抗原特异的多肽候选物，同时降低预测的毒性和溶血风险，并且生成速度比 PepTune 快三个数量级以上。

## 2 方法

参考图注图 2：Pepti-drift 框架概述。目标抗原序列由冻结的 ESM-2 模型编码。抗原嵌入与高斯噪声一起传递给抗原条件潜在生成器，产生初始多肽潜在表示z0z\_\{0\}。然后，漂移块通过应用学习到的向量场V=Vatt\+VrepV=V\_\{\\mathrm\{att\}\}\+V\_\{\\mathrm\{rep\}\}来细化z0z\_\{0\}，该场结合了朝向结合肽分布的吸引和远离毒性相关分布的排斥，产生漂移后的潜在表示z1z\_\{1\}。最后，非自回归 Transformer 解码器在单次前向传递中从z1z\_\{1\}生成多肽序列。Pepti-drift 旨在学习到的潜在多肽空间中进行抗原条件性多肽生成（图2 (https://arxiv.org/html/2606.27824#S2.F2)）。设aa表示抗原序列，yy表示多肽序列，θ\\theta表示所有可训练参数集。蛋白质语言模型编码器在训练期间冻结。

### 2.1 表示空间

漂移目标需要一个潜在空间，其中生成的和参考多肽之间的距离是有意义的：生成的潜在表示应接近结合肽，远离毒性肽。原始的 ESM-2 嵌入是高维的，并针对掩码 token 预测进行了优化，而不是针对这种几何属性。因此，我们学习一个紧凑的归一化投影，重塑嵌入空间以适应漂移目标。

抗原和多肽序列首先由冻结的 ESM-2（3B）模型编码：

eA\(a\)∈RdA,eP\(y\)∈RdP,e\_\{A\}\(a\)\\in\\mathbb\{R\}^\{d\_\{A\}\},\\qquad e\_\{P\}\(y\)\\in\\mathbb\{R\}^\{d\_\{P\}\},\(1\)其中dA=dP=2560d\_\{A\}=d\_\{P\}=2560。然后学习到的投影头将这些嵌入映射到模型使用的空间。抗原嵌入被转换为条件表示：

hθ\(a\)=φA,θ\(eA\(a\)\)∈Rdh,h\_\{\\theta\}\(a\)=\\phi\_\{A,\\theta\}\(e\_\{A\}\(a\)\)\\in\\mathbb\{R\}^\{d\_\{h\}\},\(2\)其中dh=2560d\_\{h\}=2560。每个多肽嵌入被投影并l2\\ell\_\{2\}-归一化到单位超球面上：

uθ\(y\)=norm⁡\(φP,θ\(eP\(y\)\)\)∈Sdz−1,norm⁡\(v\)=v‖v‖2,u\_\{\\theta\}\(y\)=\\operatorname\{norm\}\\\!\\left\(\\phi\_\{P,\\theta\}\(e\_\{P\}\(y\)\)\\right\)\\in\\mathbb\{S\}^\{d\_\{z\}\-1\},\\qquad\\operatorname\{norm\}\(v\)=\\frac\{v\}\{\\\|v\\\|\_\{2\}\},\(3\)其中dz=1024d\_\{z\}=1024。归一化确保余弦相似度主导此空间中的距离，防止模型将潜在表示坍缩到原点。生成器、漂移模块和解码器都在此共享空间中操作。

对于训练，每个抗原aia\_\{i\}与一个已知的结合肽yi\+y\_\{i\}^\{\+\}配对，其投影ui\+=uθ\(yi\+\)u\_\{i\}^\{\+\}=u\_\{\\theta\}\(y\_\{i\}^\{\+\}\)作为抗原匹配的正教师潜在表示。相反，与毒性和溶血相关的多肽被视为抗原独立的负参考。设Y−=\{yj−\}j=1M\\mathcal\{Y\}^\{\-\}=\\\{y\_\{j\}^\{\-\}\\\}\_\{j=1\}^\{M\}表示全局负多肽池，其投影潜在表示为uj−=uθ\(yj−\)u\_\{j\}^\{\-\}=u\_\{\\theta\}\(y\_\{j\}^\{\-\\}\)。

对于每个训练示例ii，我们从Y−\\mathcal\{Y\}^\{\-\}中采样候选负样本。在构建漂移目标期间，单步漂移产生生成潜在表示xix\_\{i\}后，我们保留离x ̄i=norm⁡\(xi\)\\bar\{x\}\_\{i\}=\\operatorname\{norm\}\(x\_\{i\}\)最近的KiK\_\{i\}个硬负样本，在归一化潜在空间中使用均方距离。我们将这些选定的硬负潜在表示记为\{ui,k−\}k=1Ki\\\{u\_\{i,k\}^\{\-\}\\\}\_\{k=1\}^\{K\_\{i\}\}，其中每个ui,k−u\_\{i,k\}^\{\-\}从全局池中选择。这些硬负样本定义了要避免的局部毒性相关区域。

### 2.2 单步潜在生成与漂移

Pepti-drift 在单次前向传递中生成多肽：噪声输入，序列输出。这是通过组合两个模块实现的。首先，抗原条件生成器将高斯噪声映射到初始多肽潜在表示。然后，漂移模块在一步中细化此潜在表示，将其引向潜在空间的目标区域。

给定一个噪声向量ξi∼N\(0,Idz\)\\xi\_\{i\}\\sim\\mathcal\{N\}\(0,I\_\{d\_\{z\}\}\)，生成器产生初始潜在表示：

zi,0=Gθ\(hθ\(ai\),ξi\)。

Pepti-drift：抗原条件性离散肽生成的毒性排斥漂移方法

相似文章

Pepti-Agent：用于多肽设计与优化的人工智能代理

AgForce 实现抗原条件生成式抗体设计

通过分类器引导的胚系吸收离散扩散实现抗体序列的条件生成

基于内存高效等变变压器的可扩展肽设计

DriftGuard：面向毒性审核演化的安全感知多监控检测与选择性自适应方法

提交意见反馈