EvoScientist:面向端到端科学发现的多智能体进化AI科学家

Papers with Code Trending 论文

摘要

EvoScientist 是一个用于端到端科学发现的自适应多智能体框架,通过持久化记忆模块持续改进,由三个专业智能体组成,分别负责创意生成、实验执行和知识提炼。它在科学创意生成方面超越了7个当前最先进的系统,并通过多智能体进化提升了代码执行成功率。

随着大型语言模型(LLMs)的广泛应用,AI 科学家已能够执行复杂的端到端科学发现任务,这类任务需要协调多个专业角色,包括创意生成和实验执行。然而,大多数当前最先进的 AI 科学家系统依赖静态的、手工设计的流程,无法根据积累的交互历史进行自适应调整。因此,这些系统往往忽视了有潜力的研究方向、重复已失败的实验,并追求不可行的想法。为解决这一问题,我们提出了 EvoScientist——一个通过持久化记忆和自我进化持续改进研究策略的进化式多智能体 AI 科学家框架。EvoScientist 由三个专业智能体组成:负责科学创意生成的研究员智能体(RA)、负责实验实现与执行的工程师智能体(EA),以及将历史交互中的洞察提炼为可复用知识的进化管理智能体(EMA)。EvoScientist 包含两个持久化记忆模块:(i)创意记忆,用于汇总排名靠前的可行研究方向,同时记录此前失败的方向;(ii)实验记忆,用于捕捉从代码搜索轨迹和最优实现中提炼出的有效数据处理与模型训练策略。这些模块使 RA 和 EA 能够检索相关的历史策略,从而随时间推移持续提升创意质量和代码执行成功率。实验表明,EvoScientist 在科学创意生成方面超越了 7 个开源及商业的当前最先进系统,在自动评估和人工评估中均实现了更高的新颖性、可行性、相关性和清晰度。EvoScientist 还通过多智能体进化大幅提升了代码执行成功率,充分证明了持久化记忆在端到端科学发现中的有效性。
查看原文
查看缓存全文

缓存时间: 2026/05/09 12:31

论文页面 - EvoScientist: 迈向端到端科学发现的多智能体进化AI科学家

来源: https://huggingface.co/papers/2603.08127

摘要

EvoScientist 是一个自适应多智能体框架,通过持久记忆模块从过去的交互中持续学习,从而增强科学发现能力。

随着大语言模型(LLMs)的广泛应用,AI 科学家已能够执行复杂的端到端科学发现任务,这些任务需要协调专业化角色,包括想法生成和实验执行。然而,大多数最先进的 AI 科学家系统依赖于静态的、手工设计的流水线,无法根据积累的交互历史进行自适应调整。因此,这些系统往往忽视有潜力的研究方向、重复失败的实验,并追求不可行的想法。为解决这些问题,我们提出了 EvoScientist——一个通过持久记忆和自我进化持续优化研究策略的多智能体 AI 科学家框架。EvoScientist 包含三个专业化智能体:用于科学想法生成研究员智能体(RA)、用于实验实现与执行的工程师智能体(EA),以及将先前交互中的洞见提炼为可复用知识的进化管理智能体(EMA)。EvoScientist 包含两个持久记忆模块:(i)构思记忆,用于从排名靠前的想法中总结可行的研究方向,同时记录此前失败的方向;(ii)实验记忆,用于捕捉从代码搜索轨迹和最优实现中获得的有效数据处理与模型训练策略。这些模块使 RA 和 EA 能够检索相关的先验策略,从而随时间推移提升想法质量和代码执行成功率。实验表明,EvoScientist 在科学想法生成方面优于 7 个开源和商业最先进系统,在自动评估和人工评估中均实现了更高的新颖性、可行性、相关性和清晰度。EvoScientist 还通过多智能体进化大幅提升了代码执行成功率,充分展示了持久记忆在端到端科学发现中的有效性。

查看 arXiv 页面 查看 PDF GitHub 2.76k 加入收藏

在你的智能体中获取本论文:

hf papers read 2603.08127

没有最新版 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用本论文的模型 0

暂无模型关联此论文

在模型的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。

引用本论文的数据集 0

暂无数据集关联此论文

在数据集的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。

引用本论文的 Spaces 0

暂无 Space 关联此论文

在 Space 的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。

收录本论文的合集 2

相似文章

EvoMaster:构建可进化大规模自主科学智能体的基础框架

Hugging Face Daily Papers

# 论文页面 - EvoMaster:构建可进化大规模自主科学智能体的基础框架 来源:[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架,专为大规模科学发现设计,支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。