SimpleMem: 面向大语言模型智能体的高效终身记忆

Papers with Code Trending 论文

摘要

介绍SimpleMem,一种面向LLM智能体的高效记忆框架,利用语义无损压缩提升准确率并降低token消耗,F1分数提升26.4%,推理时token使用量减少高达30倍。

为了支持在复杂环境中可靠的长期交互,LLM智能体需要能够高效管理历史经验的记忆系统。现有方法要么通过被动上下文扩展保留完整的交互历史,导致大量冗余,要么依赖迭代推理来过滤噪声,从而导致高昂的token成本。为解决这一挑战,我们引入了SimpleMem,一种基于语义无损压缩的高效记忆框架。我们提出了一个三阶段流水线,旨在最大化信息密度和token利用率:(1) 语义结构化压缩,应用熵感知过滤将非结构化交互提炼为紧凑的多视角索引记忆单元;(2) 递归记忆整合,一种异步过程,将相关单元整合为更高级的抽象表示以减少冗余;(3) 自适应查询感知检索,根据查询复杂度动态调整检索范围,以高效构建精确上下文。在基准数据集上的实验表明,我们的方法在准确率、检索效率和推理成本上持续优于基线方法,平均F1提升26.4%,同时推理时token消耗减少高达30倍,展现了性能与效率之间的优越平衡。代码可在https://github.com/aiming-lab/SimpleMem获取。
查看原文
查看缓存全文

缓存时间: 2026/05/24 00:26

论文页面 - SimpleMem:面向LLM智能体的高效终身记忆系统

来源:https://huggingface.co/papers/2601.02553

摘要

为了在复杂环境中支持可靠的长期交互,LLM智能体需要能够高效管理历史经验的记忆系统。现有方法要么通过被动上下文扩展保留完整的交互历史,导致大量冗余;要么依赖迭代推理来过滤噪声,产生高昂的token成本。为解决这一挑战,我们提出了SimpleMem,一种基于语义无损压缩的高效记忆框架。我们设计了一个三阶段流水线,旨在最大化信息密度和token利用率:(1) 语义结构化压缩,应用熵感知过滤,将非结构化交互提炼为紧凑的多视角索引记忆单元;(2) 递归记忆整合,一个异步过程,将相关单元整合为更高级的抽象表示以减少冗余;(3) 自适应查询感知检索,根据查询复杂度动态调整检索范围,以高效构建精准上下文。在基准数据集上的实验表明,我们的方法在准确性、检索效率和推理成本方面持续优于基线方法,平均F1提升26.4%,同时推理时token消耗降低高达30倍,展示了性能与效率之间的卓越平衡。代码可在 https://github.com/aiming-lab/SimpleMem 获取。

查看 arXiv 页面 (https://arxiv.org/abs/2601.02553) 查看 PDF (https://arxiv.org/pdf/2601.02553) 项目页面 (https://aiming-lab.github.io/SimpleMem-Page/) GitHub 3.39k (https://github.com/aiming-lab/SimpleMem) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2601.02553)

在你的智能体中获取此论文:

hf papers read 2601.02553

没有最新CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2601.02553 即可从此页面链接。

引用此论文的数据集2

molmohsen/awesome-ai-agent-papers (https://huggingface.co/datasets/molmohsen/awesome-ai-agent-papers)

zhongweixie/A-Survey-on-AI-Agent-Harness Viewer • 更新于2天前 • 1 • 28 (https://huggingface.co/datasets/zhongweixie/A-Survey-on-AI-Agent-Harness)

引用此论文的空间0

没有空间链接此论文

在空间 README.md 中引用 arxiv.org/abs/2601.02553 即可从此页面链接。

包含此论文的收藏集4

相似文章

DimMem:面向高效长期智能体记忆的维度结构化

arXiv cs.CL

DimMem 提出了一种用于 LLM 智能体的维度记忆框架,将记忆表示为具有显式字段的原子化、类型化单元,在 LoCoMo-10 和 LongMemEval-S 上实现了最先进的准确率,同时将 token 成本降低了 24%。

ElasticMem:作为LLM智能体可学习资源的潜在记忆

arXiv cs.CL

ElasticMem 为 LLM 智能体引入了一种可学习的潜在记忆机制,该机制能够自适应地为检索到的记忆分配可变预算,从而在减少 token 成本的同时,提升内存密集型问答和具身智能体任务的性能。