NanoResearch:协同进化技能、记忆与策略以实现个性化研究自动化
摘要
NanoResearch 是一个多智能体框架,旨在通过协同进化技能、记忆和策略,适应个人用户的偏好和研究风格,从而实现个性化研究自动化。
查看缓存全文
缓存时间: 2026/05/12 07:30
论文页面 - NanoResearch:通过共演化技能、记忆与策略实现个性化研究自动化
来源:https://huggingface.co/papers/2605.10813 作者:
,
,
,
,
,
,
,
,
,
,
,
,
,
摘要
NanoResearch 是一个多智能体框架,它通过累积可复用的技能、维护用户特定的经验,以及通过共演化组件内化隐性偏好,从而通过个性化辅助增强研究自动化。
由大型语言模型(LLM)驱动的多智能体系统如今已能自动化从构思到论文撰写的全流程研究管道,但一个根本性问题依然存在:自动化是服务于谁的?研究人员在不同的资源配置下工作,持有不同的方法论偏好,并针对不同的输出格式。如果系统无视这些差异而产生统一的输出,它将无法系统地满足每一位个体用户的需求,因此,个性化(https://huggingface.co/papers?q=personalization)是研究自动化(https://huggingface.co/papers?q=research%20automation)真正可用的先决条件。然而,实现这一点需要当前系统所缺乏的三种能力:跨项目累积可复用的程序性知识(https://huggingface.co/papers?q=procedural%20knowledge)、跨会话保留用户特定的经验(https://huggingface.co/papers?q=user-specific%20experience),以及内化难以明确形式化的隐性偏好(https://huggingface.co/papers?q=implicit%20preferences)。我们提出了 NanoResearch,这是一个多智能体框架(https://huggingface.co/papers?q=multi-agent%20framework),通过三级共演化(https://huggingface.co/papers?q=co-evolution)来解决这些不足。技能库(https://huggingface.co/papers?q=skill%20bank)将重复出现的操作提炼为紧凑的程序规则,以便在不同项目中复用。记忆模块(https://huggingface.co/papers?q=memory%20module)维护用户和项目的特定经验,使规划决策基于每位用户的研究历史。无标签策略学习(https://huggingface.co/papers?q=label-free%20policy%20learning)将自由形式的反馈转化为规划器的持久参数更新,从而重塑后续的协调过程。这三个层级共同演化:可靠的技能产生更丰富的记忆,更丰富的记忆指导更好的规划,而偏好的内化则不断将该循环重新对齐到每位用户身上。大量实验表明,NanoResearch 相比最先进的 AI 研究系统取得了显著的提升,并在连续循环中逐步自我优化,以更低成本产出更高质量的研究成果。
查看 arXiv 页面(https://arxiv.org/abs/2605.10813)查看 PDF(https://arxiv.org/pdf/2605.10813)GitHub910(https://github.com/OpenRaiser/NanoResearch)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2605.10813)
在你的智能体中获取这篇论文:
hf papers read 2605\.10813
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文模型0
没有链接到此论文的模型
在模型 README.md 中引用 arxiv.org/abs/2605.10813 以从此页面链接。
引用此论文数据集0
没有链接到此论文的数据集
在数据集 README.md 中引用 arxiv.org/abs/2605.10813 以从此页面链接。
引用此论文的 Spaces0
没有链接到此论文的 Space
在 Space README.md 中引用 arxiv.org/abs/2605.10813 以从此页面链接。
包含此论文的收藏集1
相似文章
利用专家代理进行自动研究:开发高效且非平凡的训练配方
本文介绍了一种自动研究框架,利用专家代理通过代码执行与反馈的经验闭环,迭代优化训练配方。该系统借助谱系反馈(lineage feedback),无需人工干预,即可在 Parameter Golf 和 NanoChat 等任务上自主提升性能。
AutoResearch AI:迈向AI驱动的科学发现研究自动化
一篇综述论文,探讨了AI从特定任务助手到工作流级研究自动化工具的转变,将AutoResearch定义为AI驱动的科学工作流自动化的光谱,并分析了自主性、可重复性和问责制方面的挑战。
@tom_doerr:通过持久化多智能体记忆自动化研究工作流程 https://github.com/EvoScientist/EvoScientist…
EvoScientist 是一个开源框架,利用具备持久化多智能体记忆的自进化 AI 科学家来自动化研究工作流程,采用"人在回路外"范式,实现自主研究探索与洞察生成。
AutoResearchClaw:自我强化的自主研究与人机协作
AutoResearchClaw是一个多智能体自主研究系统,通过结构化辩论、自我修复执行和人机协作来改进科学发现,在ARC-Bench基准上比之前的系统高出54.7%。
AutoResearch AI:迈向人工智能驱动的研究自动化以实现科学发现
本综述审视了人工智能驱动的研究自动化(AutoResearch)这一新兴领域,分析了AI系统如何从孤立的任务辅助转向完整的工作流级别的科学发现。它定义了从人类引导的‘Vibe Research’到AI主导系统的光谱,并提出了五个评估科学可信度的维度。