EvolveMem: 通过AutoResearch实现LLM智能体的自演化记忆架构
摘要
EvolveMem为LLM智能体引入了一种自演化记忆架构,通过LLM驱动的诊断和迭代研究周期来优化检索配置,在LoCoMo和MemBench等基准测试上取得了显著的性能提升。
查看缓存全文
缓存时间: 2026/05/15 04:23
论文页面 - EvolveMem:面向LLM智能体的自演化记忆架构
来源:https://huggingface.co/papers/2605.13941
摘要
EvolveMem通过自演化检索机制为LLM智能体实现自适应记忆系统,该机制能够借助诊断模块和迭代研究循环自主优化配置参数。
长期记忆(https://huggingface.co/papers?q=Long-term%20memory)对于跨多个会话运行的LLM智能体(https://huggingface.co/papers?q=LLM%20agents)至关重要,但现有记忆系统将检索基础设施(https://huggingface.co/papers?q=retrieval%20infrastructure)视为固定不变:存储的内容会演化,而评分函数、融合策略和答案生成策略在部署后始终保持冻结。我们提出,真正自适应的记忆需要在两个层面共同演化:存储的知识以及对其进行查询的检索机制。我们提出EvolveMem,一种自演化记忆架构(https://huggingface.co/papers?q=self-evolving%20memory),它将完整的检索配置暴露为一个由LLM驱动的诊断模块(https://huggingface.co/papers?q=LLM-powered%20diagnosis%20module)优化的结构化动作空间(https://huggingface.co/papers?q=structured%20action%20space)。在每个演化轮次中,该模块读取每个问题的失败日志,识别根本原因,并提出针对性的配置调整;一个受保护的元分析器(https://huggingface.co/papers?q=guarded%20meta-analyzer)会应用这些调整,并带有自动回滚(性能下降时)和在停滞时探索的保障机制。这种闭环自演化实现了一个AutoResearch(https://huggingface.co/papers?q=AutoResearch)过程:系统自主对其自身架构进行迭代研究循环(https://huggingface.co/papers?q=iterative%20research%20cycles),取代手动配置调优。从一个最简基线出发,该过程自主收敛,发现有效的检索策略(https://huggingface.co/papers?q=retrieval%20strategies),包括原始动作空间中不存在的全新配置维度。在LoCoMo上,EvolveMem比最强基线相对提升25.7%,比最简基线相对提升78.0%。在MemBench上,EvolveMem比最强基线相对提升18.9%。演化出的配置在跨基准测试中表现出正向迁移而非灾难性迁移,表明自演化过程捕获了普遍的检索原则而非特定于基准测试的启发式方法。代码已在 https://github.com/aiming-lab/SimpleMem 开源。
查看 arXiv 页面(https://arxiv.org/abs/2605.13941)查看 PDF(https://arxiv.org/pdf/2605.13941)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.13941)
在您的智能体中获取这篇论文:
hf papers read 2605.13941
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型 0
没有模型链接到此论文
在模型 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
引用此论文的数据集 0
没有数据集链接到此论文
在数据集 README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
引用此论文的 Spaces 0
没有 Space 链接到此论文
在 Space README.md 中引用 arxiv.org/abs/2605.13941 以从此页面链接。
包含此论文的收藏集 0
没有包含此论文的收藏集
将这篇论文添加到一个收藏集(https://huggingface.co/new-collection)以从此页面链接。
相似文章
MemEvoBench:LLM 代理内存误演化基准测试
MemEvoBench 引入了首个用于评估 LLM 代理内存安全性的基准测试,衡量对抗性内存注入、噪声输出和有偏反馈在问答与工作流任务中导致的行为衰退。该研究表明内存演化是安全失败的重要因素,且静态防御措施不足以应对。
从存储到经验:大语言模型智能体记忆机制演进综述
本综述论文提出了一种大语言模型(LLM)智能体记忆机制的演进框架,将其发展划分为三个阶段:存储、反思和经验。文章分析了长程一致性和持续学习等核心驱动力,旨在为下一代智能体的设计提供指导原则。
RecMem:基于重复的记忆整合方法,用于高效且有效的长期运行LLM智能体
RecMem是一种基于重复的记忆整合方法,适用于长期运行的LLM智能体,通过仅在语义相似的交互重复出现时调用LLM,可减少高达87%的令牌消耗,同时提高准确性。
H-Mem:一种通过混合结构实现智能体记忆演化与检索的新型记忆机制
H-Mem是一种面向基于LLM的智能体的新型记忆机制,采用时间-语义树与知识图谱相结合的混合结构,以建模记忆演化并提升检索性能,在问答基准上实现了最先进水平。
HeLa-Mem:面向LLM智能体的赫布学习与联想记忆
# HeLa-Mem: Hebbian Learning and Associative Memory for LLM Agents 来源:[https://arxiv.org/html/2604.16839](https://arxiv.org/html/2604.16839) Jinchang Zhu1,∗,a, Jindong Li1,∗, Cheng Zhang2,∗, Jiahong Liu3, Menglin Yang1,†,b 1香港科技大学(广州) 2吉林大学 3香港中文大学 [email protected] [email protected] ∗同等贡献 †通讯作者 ###### 摘要 长...