EvolveMem: 通过AutoResearch实现LLM智能体的自演化记忆架构

Hugging Face Daily Papers 论文

摘要

EvolveMem为LLM智能体引入了一种自演化记忆架构,通过LLM驱动的诊断和迭代研究周期来优化检索配置,在LoCoMo和MemBench等基准测试上取得了显著的性能提升。

长期记忆对于跨多会话运行的LLM智能体至关重要,但现有的记忆系统将检索基础设施视为固定不变的:存储的内容会演化,而评分函数、融合策略和答案生成策略在部署时保持不变。我们认为,真正自适应的记忆需要在两个层面共同演化:存储的知识以及查询它的检索机制。我们提出了EvolveMem,一种自演化记忆架构,它将完整的检索配置暴露为一个结构化的动作空间,由LLM驱动的诊断模块进行优化。在每个演化轮次中,该模块读取每个问题的失败日志,识别根本原因,并提出有针对性的配置调整;一个受保护的元分析器应用这些调整,并具有自动回滚回归和停滞时探索的安全机制。这种闭环自我演化实现了一个AutoResearch过程:系统自主地对其自身架构进行迭代研究周期,取代了手动配置调整。从一个最小的基线开始,该过程自主收敛,发现有效的检索策略,包括原始动作空间中不存在的新配置维度。在LoCoMo上,EvolveMem比最强基线相对提升25.7%,比最小基线相对提升78.0%。在MemBench上,EvolveMem比最强基线相对提升18.9%。演化后的配置在基准测试之间实现了正向转移而非灾难性转移,表明自演化过程捕获了通用的检索原则而非基准测试特定的启发式规则。代码可在https://github.com/aiming-lab/SimpleMem获取。
查看原文
查看缓存全文

缓存时间: 2026/05/15 04:23

论文页面 - EvolveMem:面向LLM智能体的自演化记忆架构

来源:https://huggingface.co/papers/2605.13941

摘要

EvolveMem通过自演化检索机制为LLM智能体实现自适应记忆系统,该机制能够借助诊断模块和迭代研究循环自主优化配置参数。

长期记忆(https://huggingface.co/papers?q=Long-term%20memory)对于跨多个会话运行的LLM智能体(https://huggingface.co/papers?q=LLM%20agents)至关重要,但现有记忆系统将检索基础设施(https://huggingface.co/papers?q=retrieval%20infrastructure)视为固定不变:存储的内容会演化,而评分函数、融合策略和答案生成策略在部署后始终保持冻结。我们提出,真正自适应的记忆需要在两个层面共同演化:存储的知识以及对其进行查询的检索机制。我们提出EvolveMem,一种自演化记忆架构(https://huggingface.co/papers?q=self-evolving%20memory),它将完整的检索配置暴露为一个由LLM驱动的诊断模块(https://huggingface.co/papers?q=LLM-powered%20diagnosis%20module)优化的结构化动作空间(https://huggingface.co/papers?q=structured%20action%20space)。在每个演化轮次中,该模块读取每个问题的失败日志,识别根本原因,并提出针对性的配置调整;一个受保护的元分析器(https://huggingface.co/papers?q=guarded%20meta-analyzer)会应用这些调整,并带有自动回滚(性能下降时)和在停滞时探索的保障机制。这种闭环自演化实现了一个AutoResearch(https://huggingface.co/papers?q=AutoResearch)过程:系统自主对其自身架构进行迭代研究循环(https://huggingface.co/papers?q=iterative%20research%20cycles),取代手动配置调优。从一个最简基线出发,该过程自主收敛,发现有效的检索策略(https://huggingface.co/papers?q=retrieval%20strategies),包括原始动作空间中不存在的全新配置维度。在LoCoMo上,EvolveMem比最强基线相对提升25.7%,比最简基线相对提升78.0%。在MemBench上,EvolveMem比最强基线相对提升18.9%。演化出的配置在跨基准测试中表现出正向迁移而非灾难性迁移,表明自演化过程捕获了普遍的检索原则而非特定于基准测试的启发式方法。代码已在 https://github.com/aiming-lab/SimpleMem 开源。

查看 arXiv 页面(https://arxiv.org/abs/2605.13941)查看 PDF(https://arxiv.org/pdf/2605.13941)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.13941)

在您的智能体中获取这篇论文:

hf papers read 2605.13941

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型 0

没有模型链接到此论文

在模型 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。

引用此论文的数据集 0

没有数据集链接到此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。

引用此论文的 Spaces 0

没有 Space 链接到此论文

在 Space README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。

包含此论文的收藏集 0

没有包含此论文的收藏集

将这篇论文添加到一个收藏集(https://huggingface.co/new-collection)以从此页面链接。

相似文章

MemEvoBench:LLM 代理内存误演化基准测试

arXiv cs.CL

MemEvoBench 引入了首个用于评估 LLM 代理内存安全性的基准测试,衡量对抗性内存注入、噪声输出和有偏反馈在问答与工作流任务中导致的行为衰退。该研究表明内存演化是安全失败的重要因素,且静态防御措施不足以应对。

从存储到经验:大语言模型智能体记忆机制演进综述

Hugging Face Daily Papers

本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。