ChemAmp: 通过可组合智能体增强化学工具

arXiv cs.CL 2026/04/20 04:00 论文

摘要

ChemAmp 引入了一种工具增强范式，通过动态协调专门的化学工具（UniMol2、Chemformer）作为可组合智能体来增强分子任务的性能。该框架性能超越了化学专用模型，并相比传统多智能体系统将推理令牌成本降低了 94%。

arXiv:2505.21569v3 公告类型：替换交叉摘要：虽然基于 LLM 的智能体已被证明能够在科学领域（特别是化学领域）掌握工具编排，但它们的单任务性能仍受到底层工具约束的限制。为此，我们提出了工具增强范式，这是一种通过优化和动态协调在个别任务中增强专门工具集体能力的新范式。在这一范式的基础上，我们介绍了 ChemAmp，一个计算量轻的框架，它动态地将化学工具（如 UniMol2、Chemformer）视为可组合的构建块智能体。它能够以有限的数据（≤10 个样本）构建超越单一工具约束的任务专用超级智能体。我们在四项核心化学任务——分子设计、分子描述、反应预测和性质预测——上的评估表明，ChemAmp 性能优于化学专用模型、通用 LLM 和具有工具编排的智能体系统。关键是，这种自下而上的构建策略使推理令牌成本相比传统多智能体系统降低了 94%。

查看原文导出为 Word 导出为 PDF

查看缓存全文

缓存时间: 2026/04/20 08:33

# ChemAmp: 通过可组合智能体放大化学工具
来源: https://arxiv.org/html/2505.21569

Zhucong Li1,3,Powei Chang211footnotemark:1,Jin Xiao2,Zhijian Zhou1, Qianyu He3,Jiaqing Liang2,Fenglei Cao4,Xu Yinghui1,Yuan Qi1,4,5
1复旦大学人工智能创新与孵化学院, 2复旦大学数据科学学院, 3复旦大学计算机科学与人工智能学院, 4上海人工智能for Science学院, 5复旦大学中山医院信息与智能发展部
\{zcli22, bwzhang24, jinxiao23\}@m\.fudan\.edu\.cn, \{liangjiaqing, xuyinghui, qiyuan\}@fudan\.edu\.cn

###### 摘要

虽然基于LLM的智能体已被证明能够在科学领域（特别是化学领域）掌握工具编排，但其单任务性能仍受底层工具约束的限制。为此，我们提出工具放大化，一种通过单个任务内优化的动态协调来增强专业工具集体能力的新范式。基于这一范式，我们引入ChemAmp，一个计算轻量级框架，将化学工具（如UniMol2、Chemformer）动态视为可组合的构建块智能体。它用有限数据（≤10个样本）构建超越原子工具约束的任务专用超级智能体。我们在四个核心化学任务上的评估——分子设计、分子标题、反应预测和性质预测——表明ChemAmp优于化学专用模型、通用LLM和具有工具编排的智能体系统。关键地，这种自下而上的构建策略相比原始多智能体系统实现了94%的推理令牌成本削减。我们的代码和数据集已在https://github.com/Chang-pw/ChemAmp公开发布。

ChemAmp: 通过可组合智能体放大化学工具

Zhucong Li1,3††thanks:平等贡献\., Powei Chang211footnotemark:1, Jin Xiao2, Zhijian Zhou1,Qianyu He3,Jiaqing Liang2,Fenglei Cao4,Xu Yinghui1,Yuan Qi1,4,5††thanks:通讯作者\.
1复旦大学人工智能创新与孵化学院,
2复旦大学数据科学学院,
3复旦大学计算机科学与人工智能学院,
4上海人工智能for Science学院,
5复旦大学中山医院信息与智能发展部
\{zcli22, bwzhang24, jinxiao23\}@m\.fudan\.edu\.cn, \{liangjiaqing, xuyinghui, qiyuan\}@fudan\.edu\.cn

## 1 引言

参考图1：研究框架。本工作介绍了一个范式转变——从工具编排（跨任务管理工具序列）到工具放大化（在原子任务内动态增强能力）。

大型语言模型（LLM）基智能体已成为自动化复杂科学工作流的强大工具，特别是在化学领域，其中它们协调涉及专业计算工具的多步骤过程。

如图1（左）所示，虽然对任务编排有效，但当前工作主要按顺序定义预定工具的使用。例如，当基于LLM的智能体处理三个潜在的管道任务（如分子设计、反应预测和性质预测）时，它会依次为每个任务选择预定的化学工具以获得计算结果。然而，一个关键的局限性仍未被解决：这些智能体在单个复杂任务上的性能根本上受到它们调用的底层工具的固有能力和范围的限制。因此，错误可能在推理链中传播。这个瓶颈限制了性能收益，并经常导致效率低下的冗余工具调用，增加计算成本。

在这项工作中，我们面对一个更根本的局限性：即使是最先进的化学工具（如UniMol2、Chemformer、ChemDFM）在单独操作时仍然受到其原子能力的限制。如图1（右）所示，我们主张从工具编排到工具放大化的根本转变，其中工具通过单个任务内的分层协调超越本地能力。与传统工具编排（跨不同任务调度工具）不同，放大化专注于通过动态组合工具使工具在单个任务内更好地协作。通过将工具动态地组合成协作团队，它们可以实现任何单个工具都无法做到的能力。

这种放大化范式引入了两个核心挑战：(1) 结构搜索复杂性：最优的智能体-工具组合因领域特定约束而在化学任务中差异很大。(2) 效率-能力权衡：手动组合不可行，而穷举搜索会产生高昂的计算成本。

为了应对这些挑战，我们引入ChemAmp（化学工具放大化），一个通过可组合智能体的分层组合实现工具放大化的框架。ChemAmp动态构建智能体层级，其中原子工具被迭代地封装成子智能体，并进一步合并为复合网络。这个两阶段过程（图2）通过突现协调放大能力，同时通过迭代细化最小化任务特定错误。

这种方法的核心是智能体复合工具A(t1,...,tn)，它具有双重角色：作为更高级智能体的可组合构建块，以及作为化学子任务的自主执行器。这种二元性使ChemAmp能够识别最优的能力增强点，其中工具协调产生超越单个功能的协同效应。

### 3.1 阶段1：原子到复合放大化

为了减少基础工具的预测误差并为阶段2丰富工具集——从而为分层协调构建更有效的搜索空间——我们启动一个预热阶段过程。给定LLM提供的初始工具集T和参数k，我们通过算法1构建全局工具库L。这个过程首先对每个原子工具tk∈T应用原子到复合放大化，其中我们通过分层封装迭代地构建智能体复合工具Ai(tk)。每个复合工具的性能通过任务特定的指标进行评估，以获得能力增强得分si，进展到下一个强化层Ai+1(tk,Ai)取决于si是否超过前一层的得分si-1超过显著性阈值δ。

迭代细化持续到性能平台化——定义为连续迭代中Δs<δ——确保实现最优能力增强。终止时，所有强化的智能体复合工具Ai+1(tk,Ai)与原始基础工具一起在L中注册，创建一个包含上下文适配工具变体、具有突现功能的多层复合工具和最小化预测不准确的错误校正版本的丰富库。这个输出L用作阶段2分层协调的基础构建块库，支持构建任务优化的工具网络。

算法1 ChemAmp
输入：初始工具集T，参数k，工具库L←∅
输出：最佳智能体复合工具A*

1: [阶段1：原子到复合放大化]
2: foreach t∈T do
3:   repeat
4:     构建并验证智能体复合工具An(t,An-1(t))
5:   until无得分改进
6:   L←L∪{t,A1,...,An}
7: endfor
8: [阶段2：跨复合协同]
9: while全局性能改进do
10:   按性能排序L；挑选t1和前k个
11:   构建并验证{A1(t1,t2),...,Ak(t1,tk)}
12:   L←L∪{t1,...,tk,A1,...,Ak}
13: endwhile

### 3.2 阶段2：跨复合协同

在阶段1之后，我们获得一个更丰富的工具库L用于通过堆叠执行分层强化。在这个阶段，主要焦点是结合和堆叠来自库L的工具，以进一步增强其性能。首先，排序工具库L，性能最高的工具（前1名）被选为强制性基础工具t1。然后它与剩余的前k个工具ttopk={t2,t3,..,tk}组合以形成

相似文章

AI让化学家通过简单描述设计分子

Reddit r/singularity

EPFL的研究人员开发了Synthegy，一个利用大型语言模型通过自然语言指令指导化学逆合成和反应机理分析的AI框架，显著提升了化学家的战略规划能力。

COMPOSITE-STEM

arXiv cs.CL

COMPOSITE-STEM 引入了一个包含70项专家策划的智能体任务的基准测试，涵盖物理、生物、化学和数学领域，旨在评估AI智能体在超越饱和基准测试的科学工作流中的表现。性能最佳的模型（Claude Opus 4.6）仅达到21.4%的准确率，表明科学推理能力存在显著差距。

利用智能体编写高效的工具——借助智能体本身

Anthropic Engineering

Anthropic 分享了为 AI 智能体设计、评估和优化工具的工程最佳实践，特别介绍了如何利用模型上下文协议（MCP）和 Claude Code 来提升智能体的性能。

@warpdotdev：为什么选 @ampcode？它堪称 CLI 编程代理界的保时捷：—— 精致的 TUI，全屏渲染 —— 智能路由，横跨前沿模型 —— 预置子代理：Librarian（研究）、Oracle（深度推理）—— 按需付费，无 token 上限

X AI KOLs Timeline

Amp 推出精致的 CLI 编程代理，具备智能模型路由、预置子代理和按需付费。

EvoMaster：构建可进化大规模自主科学智能体的基础框架

Hugging Face Daily Papers

# 论文页面 - EvoMaster：构建可进化大规模自主科学智能体的基础框架来源：[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者：,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架，专为大规模科学发现设计，支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。