LEAP: 用于钙钛矿前驱体添加剂发现的闭环框架

arXiv cs.LG 论文

摘要

LEAP框架将领域专业化的大语言模型与主动学习相结合,高效地对钙钛矿太阳能电池的前驱体添加剂进行优先级排序,在实验验证中实现了功率转换效率的提升。

arXiv:2605.20242v1 公告类型:新 摘要:高效发现前驱体添加剂对提高钙钛矿太阳能电池性能至关重要,然而巨大的化学空间使得传统的试错筛选效率低下。我们开发了LEAP(基于主动学习的钙钛矿LLM驱动探索),这是一种专家在环的闭环框架,将领域专业化的大语言模型(LLM)与主动学习相结合,用于迭代的添加剂优先级排序。该LLM经过训练,能够从钙钛矿添加剂文献中提取与机制相关的知识,并通过可解释的描述符表示候选分子,这些描述符进一步集成到贝叶斯优化流程中,以便在低数据条件下进行不确定性感知的优先级排序。在未见文献上的基准测试表明,领域专业化模型在机制一致性推理方面优于通用模型。在专家在环的概念验证研究中进行的实验验证表明,经过三轮筛选,添加剂的优先级排序得到改善,使得后期采用6-CDQ和2-CNA处理的器件平均PCE分别达到20.13%和20.87%,而对照组为19.25%,冠军PCE达到21.32%。这些结果为以下观点提供了初步证据:基于文献的机制描述符与贝叶斯优化和专家可行性审查相结合,可以支持钙钛矿光伏中机制感知的添加剂优先级排序。
查看原文
查看缓存全文

缓存时间: 2026/05/21 06:20

# LEAP: 一种用于钙钛矿前驱体添加剂发现的闭环框架 来源:https://arxiv.org/html/2605.20242  
陈智瑞(中国人民大学化学与生命资源学院,北京,中国)  
高泽峰(中国人民大学物理学院,北京,中国)  
郭鹏杰(中国人民大学物理学院,北京,中国)  
穆成(中国人民大学化学与生命资源学院,北京,中国)  
电子邮箱:[email protected][email protected][email protected]  
卢仲毅(中国人民大学物理学院,北京,中国)  
电子邮箱:[email protected][email protected][email protected]  

###### 摘要  

高效发现前驱体添加剂对于提升钙钛矿太阳能电池性能至关重要,然而巨大的化学空间使得传统的试错筛选方法效率低下。我们提出了LEAP(基于主动学习的钙钛矿型大语言模型驱动探索),这是一种专家参与的闭环框架,将领域专用的大语言模型(LLM)与主动学习相结合,用于迭代式的添加剂优先级排序。该LLM经过训练,能够从钙钛矿添加剂文献中提取与机理相关的知识,并通过可解释的描述符表示候选分子,这些描述符进一步整合到贝叶斯优化流程中,在数据稀缺条件下实现不确定性感知的优先级排序。在未见文献上的基准测试结果表明,该领域专用模型在机理一致性推理方面优于通用模型。在专家参与的验证概念研究中,实验验证显示,经过三轮筛选,后续轮次中6-CDQ和2-CNA处理的器件平均PCE分别达到20.13%和20.87%,而对照组为19.25%,最佳PCE达到21.32%。这些结果为以下观点提供了初步证据:将基于文献的机理描述符与贝叶斯优化及专家可行性审查相结合,能够支持钙钛矿光伏领域机理感知的添加剂优先级排序。  

关键词:主动学习,闭环优化,钙钛矿太阳能电池,前驱体添加剂发现  

## 引言  

钙钛矿太阳能电池(PSCs)因其优异的光电性能、溶液可加工性以及快速提升的功率转换效率(PCE),已迅速成为最有前景的光伏技术之一[kojima2009organometal, gratzel2014light, jiang2024rapid]。然而,尽管取得了这些进展,PSCs的实际发展仍受到钙钛矿结晶和缺陷形成内在复杂性的制约[liu2023stabilization]。在成膜过程中,体相和表面容易产生欠配位离子、卤素空位和界面陷阱态[xu2025point],这些会加剧非辐射复合、降低运行稳定性,并最终限制器件性能[xiong2025homogenized, jiang2023towards, tao2025suppressing, zhu2023longterm]。添加剂工程已成为应对这些挑战最有效的策略之一[zhang2023tailoring]。通过将功能分子引入前驱体溶液,可以调控结晶动力学、调节中间相[zhou2026additive]、钝化体相和界面缺陷[teale2024molecular]、改善薄膜形貌和能级排列[wang2026homogenized, isikgor2023molecular]。因此,添加剂设计在推动PSCs效率和稳定性提升方面发挥了核心作用。然而,潜在有用添加剂的化学空间极其广泛,涵盖多种功能团、相互作用模式和物理化学性质。这种组合复杂性使得实验探索资源消耗巨大,而传统的试错筛选方法难以应对搜索问题的规模[cheng2020evolutionary, herbol2018efficient]。  

人工智能的最新进展,包括人工智能驱动的逆向设计框架,为更高效的材料发现提供了潜在途径[chen2026large, jablonka2024leveraging, Han2025AIDrivenInverseDesign],但现有方法在PSCs添加剂开发方面仍存在局限[Wang2026PerovskiteAdditiveAI]。钙钛矿研究中的大多数机器学习框架旨在预定义数据集内进行性能预测[tao2021machine],而通用大语言模型则缺乏对添加剂-前驱体相互作用、缺陷化学和结晶控制的足够专业化机理理解[wang2026perovskite]。当前需要的不仅是预测性排序,而是一个领域知情系统,能够将文献规模的化学知识转化为可实验验证的假设,并根据实际验证结果迭代改进[ dagdelen2024structured]。

在此,我们开发了LEAP(基于主动学习的钙钛矿型大语言模型驱动探索),这是一个迭代式钙钛矿前驱体添加剂发现框架,将领域专用大语言模型Perovskite-RL与主动学习(AL)相结合[kusne2020onthefly]。在LEAP中,Perovskite-RL经过训练,从添加剂文献中提取与机理相关的知识,并通过与PSCs中添加剂功能相关的可解释描述符表示候选分子。这些知识引导的描述符随后集成到贝叶斯优化(BO)流程中,以确定候选分子进行实验验证的优先级,而新获得的实验结果则反馈回模型循环,以优化后续选择。通过这种方式,LEAP实现了一个专家参与的闭环工作流程,结合了领域特定推理、不确定性感知优先级排序、实验可行性审查以及来自器件验证的反馈。在这项验证概念研究中,该工作流程在三轮筛选中确定了添加剂的优先级,并识别出后续轮次的候选分子,这些候选分子相比对照组提升了器件级性能。这并非建立一个完全自主或普遍优化的发现平台,而是展示了基于文献的机理表示如何与贝叶斯优化相结合,在数据稀缺条件下支持可实验操作的添加剂优先级排序。与仅将LLM用于文本挖掘或分子描述不同,LEAP遵循基于语言表示的材料发现更广泛方向,通过将文献衍生的机理推理转化为可解释的描述符,这些描述符可与贝叶斯优化和实验反馈相结合[qu2024leveraging]。

## 结果  

### LEAP框架  

LEAP是一个专家参与的闭环工作流程,用于钙钛矿前驱体添加剂优先级排序,它整合了基于文献的机理推理与不确定性感知的实验选择[hase2019nextgeneration]。在此验证概念实现中,从钙钛矿添加剂文献中提取的领域知识与主动学习相结合,用于对候选分子进行优先级排序[lookman2019active],指导实验验证,并更新后续选择轮次。整体工作流程总结于图1(https://arxiv.org/html/2605.20242#Sx2.F1)。  

图1:用于钙钛矿前驱体添加剂优先级排序的LEAP专家参与闭环工作流程概述。利用文献衍生的领域知识和精心整理的分子数据库构建Perovskite-RL,而具有实测ΔPCE值的热启动添加剂则初始化GP代理模型。在每次迭代中,Perovskite-RL评估候选分子并生成软机理描述符,这些描述符与硬分子特征整合,形成用于基于GP期望改进获取的混合LEAP表示。优先排序的候选分子由领域专家审查,并在钙钛矿太阳能电池中进行实验验证。器件级读数,包括PCE、薄膜质量和缺陷抑制,被反馈以更新下一轮迭代的数据集、描述符和代理模型。

LEAP的核心是领域专用大语言模型Perovskite-RL,它通过在钙钛矿前驱体添加剂文献上进行监督微调(SFT)和强化学习(RL)训练得到[choi2024accelerating]。Perovskite-RL用于以机理相关的方式评估候选分子,并生成与添加剂功能相关的描述符。这些描述符随后与分子特征结合,并作为贝叶斯优化(BO)工作流程的输入[cisse2026automate]。具体而言,高斯过程(GP)回归器作为概率代理模型[rasmussen2006gaussian],用于估计未测试候选分子的预期性能增益和相关预测不确定性,并采用期望改进(EI)获取函数为每一轮选择确定分子优先级[jones1998efficient]。目前,LEAP以专家参与模式运行:模型优先排序的候选分子不会自动发送验证,而是首先由领域专家审查其化学合理性、商业可获得性、前驱体溶液兼容性、安全性、成本以及器件制造可行性。新获得的实验结果随后反馈回工作流程,以优化下一轮优先排序。在每个反馈循环中,新测得的器件性能被附加到现有的热启动数据集中,并与之前的实验数据一起用于重新训练GP代理模型。同时,用于Perovskite-RL评估的提示模板也会更新,以纳入最新的实验观察结果,使得累积训练集和候选池的软机理描述符在更新后的推理上下文中重新生成。然后,重新训练的代理模型和更新后的描述符用于重新计算下一轮候选选择的获取分数。

由于LEAP依赖于基于文献的机理评估作为下游候选表示和优先排序的基础,因此必须首先确立该推理组件的可靠性。我们因此构建了一个机理一致性基准,使用16篇近期选择的、严格排除在训练语料之外的钙钛矿前驱体添加剂研究。从这些未见论文中,我们整理了32个多项选择题,以测试模型是否能够生成与原文文献中报道的解释一致的机理一致性判断。

图2:机理一致性基准测试性能。(a) Perovskite-RL及基线模型在来自16篇未见添加剂论文的32个问题上的准确率。Perovskite-RL准确率的95% Wilson置信区间在主文中报告。(b) Perovskite-RL与每个基线之间的成对精确McNemar比较。柱状图显示胜率差异及Holm-Bonferroni调整后的精确McNemar P值。

如图2(a)所示,LEAP中使用的推理组件正确回答了32个问题中的25个,准确率为78.1%,95% Wilson置信区间从61.2%到89.0%。该准确率高于被评估的骨干模型和通用基线模型在同一机理一致性基准上的表现。使用成对精确McNemar检验将Perovskite-RL与每个基线进行比较,随后在五次成对比较中进行Holm-Bonferroni校正,结果如图2(b)所示[mcnemar1947note]。由于基准仅包含32个成对问题,这些统计结果应被解释为对机理一致性推理的重点检查,而非详尽的模型排名。因此,该基准为使用Perovskite-RL作为下游候选表示和优先排序的推理模块提供了初步支持。

### LEAP中的机理表示  

传统分子描述符可以捕捉候选添加剂的基本物理化学性质[moriwaki2018mordred],但它们并未明确编码添加剂影响钙钛矿结晶、缺陷钝化、界面保护和环境稳定性的更高层次机理[vasilopoulou2020molecular]。然而,对于PSCs中的添加剂发现,这些机理层面的效应往往比单纯的结构描述符与功能更直接相关。因此,LEAP构建了一种候选分子的机理感知表示,该表示旨在用于闭环发现环境中的优先排序,而非仅用于结构描述。为此,LEAP通过对候选分子进行基于文献的推理来推导软机理描述符[gupta2022matscibert]。LEAP不直接使用来自LLM的高维潜在嵌入(这些嵌入难以解释,并可能掩盖物理有意义特征的贡献[gallegos2024explainable]),而是通过沿五个机理相关维度的显式分数来表示每个分子:结合模式、界面屏蔽、疏水保护、离子相互作用潜力和电子调制[deng2020coordination, thiesbrummel2026ion]。通过这种方式,从添加剂文献中提取的领域知识被转化为一个可解释的描述符空间,该空间直接与PSCs中添加剂的功能相关联。为了提高鲁棒性,这些描述符通过重复的概率推理和聚合获得[wang2023selfconsistency],使得表示不仅能捕捉主要的机理倾向,还能捕捉候选分子之间的推理变异性。由此产生的软描述符随后与确定性硬特征(包括标准分子物理化学性质)整合,形成用于下游建模的混合表示。通过结合显式分子约束和机理层面的语义信息,LEAP建立了一个适用于后续不确定性感知候选优先排序的特征空间。

### 用于候选优先排序的LEAP  

为了在数据稀缺条件下识别可实验操作的添加剂,LEAP使用混合分子表示作为代理建模的输入空间[wang2022bayesian]。从一组实验表征的热启动添加剂开始,训练GP代理模型将组合的软硬描述符映射到目标性能指标。这种概率代理使LEAP能够为每个未测试的候选分子估计预期性能增益和相关预测不确定性[zhang2022uncertainty]。通过这种方式,候选评估不仅基于预测收益,还基于当前可用数据下该收益的评估置信度。候选优先排序随后由EI获取函数引导,该函数平衡了对预测性能良好分子的利用与对候选空间中未充分采样区域的探索。因此,LEAP并非仅按预测均值对候选分子排序,而是优先考虑那些对于后续优化轮次既具潜力又具信息量的分子。目前,该过程以专家参与模式运行,即模型优先排序的候选分子在验证前需进一步审查其化学合理性和实验可行性[adams2024human]。通过结合

相似文章

LEAP:迭代科学设计中LLM的轨迹级评估

arXiv cs.LG

本文介绍了LEAPBench,一个包含55个任务的框架,用于对迭代科学设计中的LLM进行轨迹级评估。评估显示,基于结果的评分会遗漏效率提升,并且在匹配已发表的最佳设计时,领域无关提示可以优于领域感知提示。

基于大语言模型引导树搜索的优化三维光伏结构

arXiv cs.CL

本文介绍了一个案例研究,使用大语言模型驱动的树搜索算法(ERA)结合编码代理(AntiGravity)自主生成高效三维光伏结构,克服了中纬度地区平板太阳能电池板的局限性。工作流程包括迭代修补以消除奖励黑客行为,并在各种约束条件下发现改进的设计。

LEAP:利用代理框架增强LLMs在形式数学中的能力

arXiv cs.AI

LEAP是一种代理框架,使通用LLMs能够在Lean中实现形式定理证明的最新性能,解决了2025年普特南竞赛的全部12个问题,并在新基准(Lean-IMO-Bench)上将形式化证明率从低于10%提升至70%,超越了专门系统。