Mem0:利用可扩展的长期记忆构建生产就绪的 AI 智能体
摘要
Mem0 引入了一种基于图表示的可扩展内存中心架构,旨在提升大语言模型(LLM)在长期对话中的连贯性,在显著降低延迟和 Token 成本的同时,性能优于现有的记忆系统。
查看缓存全文
缓存时间: 2026/05/08 08:40
论文页 - Mem0:构建具备可扩展长期记忆的生产级 AI Agent
来源:https://huggingface.co/papers/2504.19413
摘要
Mem0 是一种以记忆为中心、基于图结构的记忆架构,通过高效地提取、整合和检索信息,增强了大型语言模型(LLM)在长期对话中的连贯性,在准确性和计算效率方面均优于现有的记忆系统。
大型语言模型(LLM)在生成上下文连贯的响应方面表现出色,但其固定的上下文窗口在维持多轮长期对话的一致性方面带来了根本性挑战。我们提出了 Mem0(https://huggingface.co/papers?q=Mem0),这是一种可扩展的以记忆为中心的架构,通过从持续对话中动态提取、整合和检索关键信息(https://huggingface.co/papers?q=salient%20information)来解决这一问题。在此基础上,我们进一步提出了一种增强型变体,利用基于图结构的记忆(https://huggingface.co/papers?q=graph-based%20memory)表示来捕捉对话元素(https://huggingface.co/papers?q=conversational%20elements)之间复杂的关系结构。通过在 LOCOMO 基准测试(https://huggingface.co/papers?q=LOCOMO%20benchmark)上的全面评估,我们将我们的方法与六类基线进行了系统比较:(i)现有的记忆增强系统(https://huggingface.co/papers?q=memory-augmented%20systems),(ii)具有不同块大小和 k 值的检索增强生成(RAG),(iii)处理整个对话历史的全上下文方法,(iv)开源记忆解决方案(https://huggingface.co/papers?q=memory%20solution),(v)专有模型系统(https://huggingface.co/papers?q=model%20system),以及(vi)专用记忆管理平台。实证结果表明,我们的方法在四类问题(单跳(https://huggingface.co/papers?q=single-hop)、时序(https://huggingface.co/papers?q=temporal)、多跳(https://huggingface.co/papers?q=multi-hop)和开放域(https://huggingface.co/papers?q=open-domain))上均一致优于所有现有记忆系统。值得注意的是,Mem0(https://huggingface.co/papers?q=Mem0)在 LLM-as-a-Judge(https://huggingface.co/papers?q=LLM-as-a-Judge)指标上相比 OpenAI 实现了 26% 的相对提升,而带有图记忆的 Mem0(https://huggingface.co/papers?q=Mem0)总体得分比基础配置高出约 2%。除了准确率的提升,我们还显著降低了与全上下文方法相比的计算开销。具体而言,Mem0(https://huggingface.co/papers?q=Mem0)实现了 91% 的 p95 延迟降低,并节省了超过 90% 的 token 成本,在高级推理能力(https://huggingface.co/papers?q=reasoning%20capabilities)和实际部署限制之间提供了令人信服的平衡。我们的研究结果凸显了结构化、持久性记忆机制在长期对话连贯性中的关键作用,为构建更可靠、高效的 LLM 驱动 AI Agent 铺平了道路。
查看 arXiv 页面(https://arxiv.org/abs/2504.19413)查看 PDF(https://arxiv.org/pdf/2504.19413)项目页面(https://mem0.ai/research)GitHub55kauto(https://github.com/mem0ai/mem0)添加到收藏集(https://huggingface.co/login?next=%2Fpapers%2F2504.19413)
在您的 Agent 中获取此论文:
hf papers read 2504\.19413
没有最新 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
无模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2504.19413 以从此页链接。
引用此论文的数据集1
GloriaaaM/LLM-Agent-Harness-Survey 查看者• 更新于23天前 • 1 • 1.17k • 5 (https://huggingface.co/datasets/GloriaaaM/LLM-Agent-Harness-Survey)
引用此论文的应用空间1
包含此论文的收藏集14
浏览包含此论文的 14 个收藏集(https://huggingface.co/collections?paper=2504.19413)
相似文章
SimpleMem: 面向大语言模型智能体的高效终身记忆
介绍SimpleMem,一种面向LLM智能体的高效记忆框架,利用语义无损压缩提升准确率并降低token消耗,F1分数提升26.4%,推理时token使用量减少高达30倍。
Cognis:面向对话式 AI 智能体的上下文感知记忆系统
Lyzr Cognis 推出统一开源记忆系统,融合 BM25 与 Matryoshka 向量搜索并支持版本感知写入,在 LoCoMo 与 LongMemEval 基准上实现 SOTA。
DMF:一种用于对话式AI代理的确定性记忆框架
介绍DMF,一种用于对话式AI代理的确定性记忆框架,它用经典NLP和数学评分取代了基于LLM的压缩,实现了与Mem0相当的准确度,同时内存准备使用零token,总体token使用量减少高达242倍。
G-Long: 图增强内存管理用于高效长期对话代理
G-Long 提出了一种用于长期对话代理的图增强内存管理框架,利用微调的小型语言模型进行结构化三元组提取和关联检索,在响应生成和内存检索方面取得了最先进的性能,同时降低了计算开销。
RecMem:基于重复的记忆整合方法,用于高效且有效的长期运行LLM智能体
RecMem是一种基于重复的记忆整合方法,适用于长期运行的LLM智能体,通过仅在语义相似的交互重复出现时调用LLM,可减少高达87%的令牌消耗,同时提高准确性。