EvoDS:具备技能学习与上下文管理的自演化自主数据科学智能体
摘要
EvoDS 是一款自演化自主数据科学智能体,通过强化学习驱动的技能获取与自适应上下文压缩进行改进,在基准测试上超越开源智能体 28.9%。
查看缓存全文
缓存时间: 2026/06/05 06:07
论文页面 - EvoDS:具有技能学习和上下文管理的自演化自主数据科学代理
来源:https://huggingface.co/papers/2606.03841
摘要
EvoDS 引入了一个自演化的自主数据科学代理,通过技能获取和基于强化学习的自适应上下文管理来增强自身能力。
近期大型语言模型(LLM)代理的进展为自动化数据科学带来了可喜的进步。然而,现有方法仍受限于其静态的动作集合,且缺乏原则性的长程上下文管理,这阻碍了它们在多阶段、迭代式数据科学流程中跨任务积累可复用经验,以及可靠运行的能力。为解决这些挑战,我们提出了 EvoDS——一个自演化的自主数据科学代理,它通过智能体强化学习(https://huggingface.co/papers?q=agentic%20reinforcement%20learning)来学习扩展自身技能并自适应地管理长程上下文。具体而言,EvoDS 引入了两个关键策略:(1) 自主技能获取(https://huggingface.co/papers?q=Autonomous%20Skill%20Acquisition)(ASA)机制,使代理能够合成、验证并复用可执行技能;(2) 自适应上下文压缩(https://huggingface.co/papers?q=Adaptive%20Context%20Compression)(ACC)策略,将上下文管理视为一个经过学习控制的优化问题,而非被动截断。这些策略在一个两阶段的多代理训练(https://huggingface.co/papers?q=multi-agent%20training)方案中协同运作,使 EvoDS 能够随时间自主改进。理论上,我们证明了 EvoDS 的分层设计降低了工具选择错误,其优化目标与信息瓶颈原则(https://huggingface.co/papers?q=information%20bottleneck%20principle)一致,确保了上下文的高效使用。实验上,EvoDS 在四个不同基准测试中平均优于最先进的开源数据科学代理 28.9%,同时消除了令牌耗尽型失败。我们的代码和数据可在 https://github.com/usail-hkust/EvoDS 获取。
查看 arXiv 页面(https://arxiv.org/abs/2606.03841)查看 PDF(https://arxiv.org/pdf/2606.03841)项目页面(https://huggingface.co/yangzhr/EvoDS)GitHub1(https://github.com/usail-hkust/EvoDS)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2606.03841)
在您的代理中获取此论文:
hf papers read 2606.03841
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有链接此论文的模型
在模型 README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。
引用此论文的数据集0
没有链接此论文的数据集
在数据集 README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。
引用此论文的 Spaces0
没有链接此论文的 Space
在 Space README.md 中引用 arxiv.org/abs/2606.03841 以从此页面链接。
包含此论文的收藏集0
没有包含此论文的收藏集
将此论文添加到一个收藏集(https://huggingface.co/new-collection)以从此页面链接。
相似文章
EvoMaster:构建可进化大规模自主科学智能体的基础框架
# 论文页面 - EvoMaster:构建可进化大规模自主科学智能体的基础框架 来源:[https://huggingface.co/papers/2604.17406](https://huggingface.co/papers/2604.17406) 作者:,,,,,,,,,,,,,,,,,,,,, ## 摘要 EvoMaster 是一个可扩展、自我进化的智能体框架,专为大规模科学发现设计,支持在实验周期中迭代优化假设并持续积累知识。大语言模型与智能体的融合正在催生“智能体科学”新时代。
EvoScientist:面向端到端科学发现的多智能体进化AI科学家
EvoScientist 是一个用于端到端科学发现的自适应多智能体框架,通过持久化记忆模块持续改进,由三个专业智能体组成,分别负责创意生成、实验执行和知识提炼。它在科学创意生成方面超越了7个当前最先进的系统,并通过多智能体进化提升了代码执行成功率。
@tom_doerr: 半自主代理通过并行实验优化代码库 https://github.com/evo-hq/evo
Evo是一个开源工具,提供半自主代理通过并行实验优化代码库,利用树搜索和多个子代理自主发现并改进指标。
EvoSci:一种受生物启发的多智能体框架,用于科学发现的演化
EvoSci提出了一种受生物启发的多智能体框架,将进化算法与知识图谱建模相结合,以迭代生成、评估和完善研究想法,在同行评审评估中取得了最佳性能。
@tom_doerr:通过持久化多智能体记忆自动化研究工作流程 https://github.com/EvoScientist/EvoScientist…
EvoScientist 是一个开源框架,利用具备持久化多智能体记忆的自进化 AI 科学家来自动化研究工作流程,采用"人在回路外"范式,实现自主研究探索与洞察生成。