MemForest:一种具有分层时间索引的高效智能体记忆系统

Hugging Face Daily Papers 论文

摘要

MemForest 提出了一种面向长上下文 LLM 智能体的记忆框架,通过并行块提取和分层时间索引来提高可扩展性并降低延迟,在基准测试中实现了 6 倍的吞吐量提升。

记忆是启用长上下文 LLM 智能体的基本组件,通过持续的提供与更新生命周期来支持跨交互的持久状态。尽管已有大量前期工作,现有系统由于两个关键限制而面临显著的维护开销:粗粒度的状态管理和本质上顺序的更新管道。具体来说,更新通常与 LLM 推理紧密耦合,并且需要全状态重写,导致可扩展性差,且随着记忆积累,延迟不断增加。为了应对这些挑战,我们提出了 MemForest,这是一个将智能体记忆重新表述为写高效时态数据管理问题的记忆框架。MemForest 通过并行块提取打破了顺序瓶颈,将记忆构建解耦为并发、独立的操作。为了进一步消除粗粒度的维护,我们引入了 MemTree,一种分层时间索引,它将记忆组织为按时间排序的树,而不是扁平的全局摘要。这种设计用局部化的每节点更新替换了全状态重写,将维护成本降低到受影响的树路径,同时自然地保留了随时间演化的状态。我们在两个长上下文记忆基准测试 LongMemEval-S 和 LoCoMo 上评估了 MemForest。在 LongMemEval-S 上,MemForest 在有状态基线中取得了最佳整体性能,达到了 79.8% 的 pass@1 准确率,同时保持了比包括 EverMemOS 在内的最先进方法大约 6 倍的记忆构建吞吐量。
查看原文
查看缓存全文

缓存时间: 2026/05/26 06:42

论文页面 - MemForest:一种基于分层时间索引的高效智能体记忆系统

来源:https://huggingface.co/papers/2605.23986

摘要

MemForest 提出了一种适用于长上下文 LLM 智能体的记忆框架,通过并行分块提取和分层时间索引,提升了可扩展性并降低了延迟。

记忆是支持长上下文 LLM 智能体(https://huggingface.co/papers?q=long-context%20LLM%20agents)的基础组件,通过持续的“服务-更新”生命周期维护跨交互的持久状态。尽管已有大量前期工作,现有系统仍因两个关键限制而面临显著的维护开销:粗粒度的状态管理以及固有顺序的更新流水线。具体而言,更新操作往往与 LLM 推理紧密耦合,并需要进行全状态重写(https://huggingface.co/papers?q=full-state%20rewrites),导致随着记忆积累,可扩展性变差、延迟不断增加。为应对这些挑战,我们提出了 MemForest,一种记忆框架(https://huggingface.co/papers?q=memory%20framework),它将智能体记忆重新定义为一种写高效的时间数据管理(https://huggingface.co/papers?q=temporal%20data%20management)问题。MemForest 通过并行分块提取(https://huggingface.co/papers?q=parallel%20chunk%20extraction)打破了顺序瓶颈,将记忆构建解耦为并发、独立的操作。为了进一步消除粗粒度的维护,我们引入了 MemTree(https://huggingface.co/papers?q=MemTree),一种分层时间索引(https://huggingface.co/papers?q=hierarchical%20temporal%20index),它将记忆组织为时间有序的树结构,而非扁平的全局摘要。该设计用局部化的逐节点更新(https://huggingface.co/papers?q=localized%20per-node%20updates)取代全状态重写(https://huggingface.co/papers?q=full-state%20rewrites),将维护开销限制在受影响的树路径上,同时自然地保留了随时间演化的状态。我们在两个长上下文记忆基准 LongMemEval-S 和 LoCoMo 上评估了 MemForest。在 LongMemEval-S 上,MemForest 在有状态基线中取得了最佳整体性能,达到了 79.8% 的 pass@1 准确率,同时记忆构建吞吐量比包括 EverMemOS 在内的最先进方法高出约 6 倍。

查看 arXiv 页面(https://arxiv.org/abs/2605.23986) 查看 PDF(https://arxiv.org/pdf/2605.23986) 添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.23986)

在你的智能体中获取此论文:

hf papers read 2605\.23986

没有最新 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

无模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。

引用此论文的数据集0

无数据集关联此论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。

引用此论文的 Space0

无 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2605.23986 来从此页面链接。

包含此论文的收藏集0

无收藏集包含此论文

请将此论文添加到一个收藏集(https://huggingface.co/new-collection)来从此页面链接。

相似文章

DimMem:面向高效长期智能体记忆的维度结构化

arXiv cs.CL

DimMem 提出了一种用于 LLM 智能体的维度记忆框架,将记忆表示为具有显式字段的原子化、类型化单元,在 LoCoMo-10 和 LongMemEval-S 上实现了最先进的准确率,同时将 token 成本降低了 24%。