EvoScientist:面向端到端科学发现的多智能体进化AI科学家
摘要
EvoScientist 是一个用于端到端科学发现的自适应多智能体框架,通过持久化记忆模块持续改进,由三个专业智能体组成,分别负责创意生成、实验执行和知识提炼。它在科学创意生成方面超越了7个当前最先进的系统,并通过多智能体进化提升了代码执行成功率。
查看缓存全文
缓存时间: 2026/05/09 12:31
论文页面 - EvoScientist: 迈向端到端科学发现的多智能体进化AI科学家
来源: https://huggingface.co/papers/2603.08127
摘要
EvoScientist 是一个自适应多智能体框架,通过持久记忆模块从过去的交互中持续学习,从而增强科学发现能力。
随着大语言模型(LLMs)的广泛应用,AI 科学家已能够执行复杂的端到端科学发现任务,这些任务需要协调专业化角色,包括想法生成和实验执行。然而,大多数最先进的 AI 科学家系统依赖于静态的、手工设计的流水线,无法根据积累的交互历史进行自适应调整。因此,这些系统往往忽视有潜力的研究方向、重复失败的实验,并追求不可行的想法。为解决这些问题,我们提出了 EvoScientist——一个通过持久记忆和自我进化持续优化研究策略的多智能体 AI 科学家框架。EvoScientist 包含三个专业化智能体:用于科学想法生成的研究员智能体(RA)、用于实验实现与执行的工程师智能体(EA),以及将先前交互中的洞见提炼为可复用知识的进化管理智能体(EMA)。EvoScientist 包含两个持久记忆模块:(i)构思记忆,用于从排名靠前的想法中总结可行的研究方向,同时记录此前失败的方向;(ii)实验记忆,用于捕捉从代码搜索轨迹和最优实现中获得的有效数据处理与模型训练策略。这些模块使 RA 和 EA 能够检索相关的先验策略,从而随时间推移提升想法质量和代码执行成功率。实验表明,EvoScientist 在科学想法生成方面优于 7 个开源和商业最先进系统,在自动评估和人工评估中均实现了更高的新颖性、可行性、相关性和清晰度。EvoScientist 还通过多智能体进化大幅提升了代码执行成功率,充分展示了持久记忆在端到端科学发现中的有效性。
查看 arXiv 页面 查看 PDF GitHub 2.76k 加入收藏
在你的智能体中获取本论文:
hf papers read 2603.08127
没有最新版 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型 0
暂无模型关联此论文
在模型的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。
引用本论文的数据集 0
暂无数据集关联此论文
在数据集的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。
引用本论文的 Spaces 0
暂无 Space 关联此论文
在 Space 的 README.md 中引用 arxiv.org/abs/2603.08127 即可从此页面建立关联。
收录本论文的合集 2
相似文章
EvoSci:一种受生物启发的多智能体框架,用于科学发现的演化
EvoSci提出了一种受生物启发的多智能体框架,将进化算法与知识图谱建模相结合,以迭代生成、评估和完善研究想法,在同行评审评估中取得了最佳性能。
EvoMaster:构建可进化大规模自主科学智能体的基础框架
# 论文页面 - EvoMaster:构建可进化大规模自主科学智能体的基础框架 来源:[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架,专为大规模科学发现设计,支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。
@tom_doerr:通过持久化多智能体记忆自动化研究工作流程 https://github.com/EvoScientist/EvoScientist…
EvoScientist 是一个开源框架,利用具备持久化多智能体记忆的自进化 AI 科学家来自动化研究工作流程,采用"人在回路外"范式,实现自主研究探索与洞察生成。
MetaEvo: 一种用于经验驱动型智能体持续进化的元优化框架
MetaEvo 提出了一种两阶段框架,用于基于LLM的智能体的持续进化,利用基于偏好的优化来增强原则抽象和用于经验重用的模块化架构,在推理基准测试上优于强基线。
EvoDS:具备技能学习与上下文管理的自演化自主数据科学智能体
EvoDS 是一款自演化自主数据科学智能体,通过强化学习驱动的技能获取与自适应上下文压缩进行改进,在基准测试上超越开源智能体 28.9%。