SimpleMem: 面向大语言模型智能体的高效终身记忆
摘要
介绍SimpleMem,一种面向LLM智能体的高效记忆框架,利用语义无损压缩提升准确率并降低token消耗,F1分数提升26.4%,推理时token使用量减少高达30倍。
查看缓存全文
缓存时间: 2026/05/24 00:26
论文页面 - SimpleMem:面向LLM智能体的高效终身记忆系统
来源:https://huggingface.co/papers/2601.02553
摘要
为了在复杂环境中支持可靠的长期交互,LLM智能体需要能够高效管理历史经验的记忆系统。现有方法要么通过被动上下文扩展保留完整的交互历史,导致大量冗余;要么依赖迭代推理来过滤噪声,产生高昂的token成本。为解决这一挑战,我们提出了SimpleMem,一种基于语义无损压缩的高效记忆框架。我们设计了一个三阶段流水线,旨在最大化信息密度和token利用率:(1) 语义结构化压缩,应用熵感知过滤,将非结构化交互提炼为紧凑的多视角索引记忆单元;(2) 递归记忆整合,一个异步过程,将相关单元整合为更高级的抽象表示以减少冗余;(3) 自适应查询感知检索,根据查询复杂度动态调整检索范围,以高效构建精准上下文。在基准数据集上的实验表明,我们的方法在准确性、检索效率和推理成本方面持续优于基线方法,平均F1提升26.4%,同时推理时token消耗降低高达30倍,展示了性能与效率之间的卓越平衡。代码可在 https://github.com/aiming-lab/SimpleMem 获取。
查看 arXiv 页面 (https://arxiv.org/abs/2601.02553) 查看 PDF (https://arxiv.org/pdf/2601.02553) 项目页面 (https://aiming-lab.github.io/SimpleMem-Page/) GitHub 3.39k (https://github.com/aiming-lab/SimpleMem) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2601.02553)
在你的智能体中获取此论文:
hf papers read 2601.02553
没有最新CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2601.02553 即可从此页面链接。
引用此论文的数据集2
molmohsen/awesome-ai-agent-papers (https://huggingface.co/datasets/molmohsen/awesome-ai-agent-papers)
zhongweixie/A-Survey-on-AI-Agent-Harness Viewer • 更新于2天前 • 1 • 28 (https://huggingface.co/datasets/zhongweixie/A-Survey-on-AI-Agent-Harness)
引用此论文的空间0
没有空间链接此论文
在空间 README.md 中引用 arxiv.org/abs/2601.02553 即可从此页面链接。
包含此论文的收藏集4
相似文章
RecMem:基于重复的记忆整合方法,用于高效且有效的长期运行LLM智能体
RecMem是一种基于重复的记忆整合方法,适用于长期运行的LLM智能体,通过仅在语义相似的交互重复出现时调用LLM,可减少高达87%的令牌消耗,同时提高准确性。
Mem0:利用可扩展的长期记忆构建生产就绪的 AI 智能体
Mem0 引入了一种基于图表示的可扩展内存中心架构,旨在提升大语言模型(LLM)在长期对话中的连贯性,在显著降低延迟和 Token 成本的同时,性能优于现有的记忆系统。
DimMem:面向高效长期智能体记忆的维度结构化
DimMem 提出了一种用于 LLM 智能体的维度记忆框架,将记忆表示为具有显式字段的原子化、类型化单元,在 LoCoMo-10 和 LongMemEval-S 上实现了最先进的准确率,同时将 token 成本降低了 24%。
ElasticMem:作为LLM智能体可学习资源的潜在记忆
ElasticMem 为 LLM 智能体引入了一种可学习的潜在记忆机制,该机制能够自适应地为检索到的记忆分配可变预算,从而在减少 token 成本的同时,提升内存密集型问答和具身智能体任务的性能。
DELTAMEM:基于残差树的LLM智能体增量经验记忆
DeltaMem将LLM智能体记忆组织成残差树,以减少冗余和检索冲突,存储经验的增量变体以支持持续学习。