EvolveMem: 通过AutoResearch实现LLM智能体的自演化记忆架构
摘要
EvolveMem为LLM智能体引入了一种自演化记忆架构,通过LLM驱动的诊断和迭代研究周期来优化检索配置,在LoCoMo和MemBench等基准测试上取得了显著的性能提升。
查看缓存全文
缓存时间: 2026/05/15 04:23
论文页面 - EvolveMem:面向LLM智能体的自演化记忆架构
来源:https://huggingface.co/papers/2605.13941
摘要
EvolveMem通过自演化检索机制为LLM智能体实现自适应记忆系统,该机制能够借助诊断模块和迭代研究循环自主优化配置参数。
长期记忆(https://huggingface.co/papers?q=Long-term%20memory)对于跨多个会话运行的LLM智能体(https://huggingface.co/papers?q=LLM%20agents)至关重要,但现有记忆系统将检索基础设施(https://huggingface.co/papers?q=retrieval%20infrastructure)视为固定不变:存储的内容会演化,而评分函数、融合策略和答案生成策略在部署后始终保持冻结。我们提出,真正自适应的记忆需要在两个层面共同演化:存储的知识以及对其进行查询的检索机制。我们提出EvolveMem,一种自演化记忆架构(https://huggingface.co/papers?q=self-evolving%20memory),它将完整的检索配置暴露为一个由LLM驱动的诊断模块(https://huggingface.co/papers?q=LLM-powered%20diagnosis%20module)优化的结构化动作空间(https://huggingface.co/papers?q=structured%20action%20space)。在每个演化轮次中,该模块读取每个问题的失败日志,识别根本原因,并提出针对性的配置调整;一个受保护的元分析器(https://huggingface.co/papers?q=guarded%20meta-analyzer)会应用这些调整,并带有自动回滚(性能下降时)和在停滞时探索的保障机制。这种闭环自演化实现了一个AutoResearch(https://huggingface.co/papers?q=AutoResearch)过程:系统自主对其自身架构进行迭代研究循环(https://huggingface.co/papers?q=iterative%20research%20cycles),取代手动配置调优。从一个最简基线出发,该过程自主收敛,发现有效的检索策略(https://huggingface.co/papers?q=retrieval%20strategies),包括原始动作空间中不存在的全新配置维度。在LoCoMo上,EvolveMem比最强基线相对提升25.7%,比最简基线相对提升78.0%。在MemBench上,EvolveMem比最强基线相对提升18.9%。演化出的配置在跨基准测试中表现出正向迁移而非灾难性迁移,表明自演化过程捕获了普遍的检索原则而非特定于基准测试的启发式方法。代码已在 https://github.com/aiming-lab/SimpleMem 开源。
查看 arXiv 页面(https://arxiv.org/abs/2605.13941)查看 PDF(https://arxiv.org/pdf/2605.13941)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.13941)
在您的智能体中获取这篇论文:
hf papers read 2605.13941
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型 0
没有模型链接到此论文
在模型 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
引用此论文的数据集 0
没有数据集链接到此论文
在数据集 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
引用此论文的 Spaces 0
没有 Space 链接到此论文
在 Space README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
包含此论文的收藏集 0
没有包含此论文的收藏集
将这篇论文添加到一个收藏集(https://huggingface.co/new-collection)以从此页面链接。
相似文章
通过参数化记忆扩展自进化智能体
来自阿里巴巴/Qwen和北京大学的研究人员提出了TMEM——一种自进化参数化记忆框架。该框架利用在线LoRA权重更新,使LLM智能体能够在单个回合内真正从经验中学习,而非仅依赖提示空间中的记忆。TMEM在多个基准测试(包括LoCoMo、LongMemEval-S和CL-Bench)上均优于基于摘要和基于检索的基线方法。
EvoArena:追踪记忆演化以实现动态环境中鲁棒的LLM智能体
EvoArena引入了一个基准测试,用于评估LLM智能体在动态环境中的表现,该环境在终端、软件和社交领域具有渐进式更新;同时EvoMem提出了一种基于补丁的记忆范式,记录结构化的演化;实验表明,当前智能体在EvoArena上仅达到39.6%的准确率,而EvoMem在该基准测试上平均提升1.5%,并在GAIA和LoCoMo上也有所改进。
MemEvoBench:LLM 代理内存误演化基准测试
MemEvoBench 引入了首个用于评估 LLM 代理内存安全性的基准测试,衡量对抗性内存注入、噪声输出和有偏反馈在问答与工作流任务中导致的行为衰退。该研究表明内存演化是安全失败的重要因素,且静态防御措施不足以应对。
从存储到经验:大语言模型智能体记忆机制演进综述
本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。
AutoMem: 作为认知技能的记忆自动化学习
AutoMem 引入了一个框架,将记忆管理作为 LLM 的可训练技能进行自动化学习,通过优化记忆结构和熟练度,将长期任务的性能提升 2-4 倍。