EvoDS:具备技能学习与上下文管理的自演化自主数据科学智能体

Hugging Face Daily Papers 论文

摘要

EvoDS 是一款自演化自主数据科学智能体,通过强化学习驱动的技能获取与自适应上下文压缩进行改进,在基准测试上超越开源智能体 28.9%。

近年来,大型语言模型(LLM)智能体的发展推动了自动化数据科学领域的显著进步。然而,现有方法仍受限于其静态动作集以及缺乏原则性的长程上下文管理,这阻碍了它们跨任务积累可复用经验以及在多阶段、迭代式数据科学流水线中可靠运行的能力。为解决这些挑战,我们提出了 EvoDS,一种通过智能体强化学习来扩展自身技能并自适应管理长程上下文的自演化自主数据科学智能体。具体而言,EvoDS 引入了两项关键策略:(1) 自主技能获取(ASA)机制,使智能体能够合成、验证并复用可执行技能;(2) 自适应上下文压缩(ACC)策略,将上下文管理视为一个学得的控制问题而非被动截断。这些策略在一个两阶段多智能体训练方案中进行协调,使 EvoDS 能够自主地随时间改进。理论上,我们证明 EvoDS 的层级设计降低了工具选择错误,其优化目标符合信息瓶颈原则,确保了上下文的高效利用。实验上,EvoDS 在四个不同的基准测试上平均超越最先进的开源数据科学智能体 28.9%,同时消除了令牌溢出失败。我们的代码和数据可在 https://github.com/usail-hkust/EvoDS 获取。
查看原文
查看缓存全文

缓存时间: 2026/06/05 06:07

论文页面 - EvoDS:具有技能学习和上下文管理的自演化自主数据科学代理

来源:https://huggingface.co/papers/2606.03841

摘要

EvoDS 引入了一个自演化的自主数据科学代理,通过技能获取和基于强化学习的自适应上下文管理来增强自身能力。

近期大型语言模型(LLM)代理的进展为自动化数据科学带来了可喜的进步。然而,现有方法仍受限于其静态的动作集合,且缺乏原则性的长程上下文管理,这阻碍了它们在多阶段、迭代式数据科学流程中跨任务积累可复用经验,以及可靠运行的能力。为解决这些挑战,我们提出了 EvoDS——一个自演化的自主数据科学代理,它通过智能体强化学习(https://huggingface.co/papers?q=agentic%20reinforcement%20learning)来学习扩展自身技能并自适应地管理长程上下文。具体而言,EvoDS 引入了两个关键策略:(1) 自主技能获取(https://huggingface.co/papers?q=Autonomous%20Skill%20Acquisition)(ASA)机制,使代理能够合成、验证并复用可执行技能;(2) 自适应上下文压缩(https://huggingface.co/papers?q=Adaptive%20Context%20Compression)(ACC)策略,将上下文管理视为一个经过学习控制的优化问题,而非被动截断。这些策略在一个两阶段的多代理训练(https://huggingface.co/papers?q=multi-agent%20training)方案中协同运作,使 EvoDS 能够随时间自主改进。理论上,我们证明了 EvoDS 的分层设计降低了工具选择错误,其优化目标与信息瓶颈原则(https://huggingface.co/papers?q=information%20bottleneck%20principle)一致,确保了上下文的高效使用。实验上,EvoDS 在四个不同基准测试中平均优于最先进的开源数据科学代理 28.9%,同时消除了令牌耗尽型失败。我们的代码和数据可在 https://github.com/usail-hkust/EvoDS 获取。

查看 arXiv 页面(https://arxiv.org/abs/2606.03841)查看 PDF(https://arxiv.org/pdf/2606.03841)项目页面(https://huggingface.co/yangzhr/EvoDS)GitHub1(https://github.com/usail-hkust/EvoDS)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2606.03841)

在您的代理中获取此论文:

hf papers read 2606.03841

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有链接此论文的模型

在模型 README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。

引用此论文的数据集0

没有链接此论文的数据集

在数据集 README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。

引用此论文的 Spaces0

没有链接此论文的 Space

在 Space README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。

包含此论文的收藏集0

没有包含此论文的收藏集

将此论文添加到一个收藏集(https://huggingface.co/new-collection)以从此页面链接。

相似文章

EvoMaster:构建可进化大规模自主科学智能体的基础框架

Hugging Face Daily Papers

# 论文页面 - EvoMaster:构建可进化大规模自主科学智能体的基础框架 来源:[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架,专为大规模科学发现设计,支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。

EvoScientist:面向端到端科学发现的多智能体进化AI科学家

Papers with Code Trending

EvoScientist 是一个用于端到端科学发现的自适应多智能体框架,通过持久化记忆模块持续改进,由三个专业智能体组成,分别负责创意生成、实验执行和知识提炼。它在科学创意生成方面超越了7个当前最先进的系统,并通过多智能体进化提升了代码执行成功率。