MemForest:一种具有分层时间索引的高效智能体记忆系统
摘要
MemForest 提出了一种面向长上下文 LLM 智能体的记忆框架,通过并行块提取和分层时间索引来提高可扩展性并降低延迟,在基准测试中实现了 6 倍的吞吐量提升。
查看缓存全文
缓存时间: 2026/05/26 06:42
论文页面 - MemForest:一种基于分层时间索引的高效智能体记忆系统
来源:https://huggingface.co/papers/2605.23986
摘要
MemForest 提出了一种适用于长上下文 LLM 智能体的记忆框架,通过并行分块提取和分层时间索引,提升了可扩展性并降低了延迟。
记忆是支持长上下文 LLM 智能体(https://huggingface.co/papers?q=long-context%20LLM%20agents)的基础组件,通过持续的“服务-更新”生命周期维护跨交互的持久状态。尽管已有大量前期工作,现有系统仍因两个关键限制而面临显著的维护开销:粗粒度的状态管理以及固有顺序的更新流水线。具体而言,更新操作往往与 LLM 推理紧密耦合,并需要进行全状态重写(https://huggingface.co/papers?q=full-state%20rewrites),导致随着记忆积累,可扩展性变差、延迟不断增加。为应对这些挑战,我们提出了 MemForest,一种记忆框架(https://huggingface.co/papers?q=memory%20framework),它将智能体记忆重新定义为一种写高效的时间数据管理(https://huggingface.co/papers?q=temporal%20data%20management)问题。MemForest 通过并行分块提取(https://huggingface.co/papers?q=parallel%20chunk%20extraction)打破了顺序瓶颈,将记忆构建解耦为并发、独立的操作。为了进一步消除粗粒度的维护,我们引入了 MemTree(https://huggingface.co/papers?q=MemTree),一种分层时间索引(https://huggingface.co/papers?q=hierarchical%20temporal%20index),它将记忆组织为时间有序的树结构,而非扁平的全局摘要。该设计用局部化的逐节点更新(https://huggingface.co/papers?q=localized%20per-node%20updates)取代全状态重写(https://huggingface.co/papers?q=full-state%20rewrites),将维护开销限制在受影响的树路径上,同时自然地保留了随时间演化的状态。我们在两个长上下文记忆基准 LongMemEval-S 和 LoCoMo 上评估了 MemForest。在 LongMemEval-S 上,MemForest 在有状态基线中取得了最佳整体性能,达到了 79.8% 的 pass@1 准确率,同时记忆构建吞吐量比包括 EverMemOS 在内的最先进方法高出约 6 倍。
查看 arXiv 页面(https://arxiv.org/abs/2605.23986) 查看 PDF(https://arxiv.org/pdf/2605.23986) 添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.23986)
在你的智能体中获取此论文:
hf papers read 2605\.23986
没有最新 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
无模型关联此论文
请在模型 README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。
引用此论文的数据集0
无数据集关联此论文
请在数据集 README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。
引用此论文的 Space0
无 Space 关联此论文
请在 Space README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。
包含此论文的收藏集0
无收藏集包含此论文
请将此论文添加到一个收藏集(https://huggingface.co/new-collection)来从此页面链接。
相似文章
H-Mem:一种通过混合结构实现智能体记忆演化与检索的新型记忆机制
H-Mem是一种面向基于LLM的智能体的新型记忆机制,采用时间-语义树与知识图谱相结合的混合结构,以建模记忆演化并提升检索性能,在问答基准上实现了最先进水平。
DimMem:面向高效长期智能体记忆的维度结构化
DimMem 提出了一种用于 LLM 智能体的维度记忆框架,将记忆表示为具有显式字段的原子化、类型化单元,在 LoCoMo-10 和 LongMemEval-S 上实现了最先进的准确率,同时将 token 成本降低了 24%。
SimpleMem: 面向大语言模型智能体的高效终身记忆
介绍SimpleMem,一种面向LLM智能体的高效记忆框架,利用语义无损压缩提升准确率并降低token消耗,F1分数提升26.4%,推理时token使用量减少高达30倍。
先个性化再存储:面向长周期智能体的个性化记忆基准测试与学习
本文介绍了PerMemBench,这是首个用于评估基于LLM的智能体中个性化记忆系统的基准测试,并提出了一个会话级存储门控框架,该框架根据个体用户上下文调整记忆策略。
MemoryOS —— 具备时序知识图谱的 AI 智能体记忆,实现 9ms 摄取与 78ms 检索
MemoryOS 是一款开源、可自托管的 AI Agent 记忆工具,它利用时序知识图谱技术,在 LongMemEval-s 基准测试中实现了 86.2% 的准确率,并以 78 毫秒的快速检索速度著称。