标签
Mnemo是一个开源、本地优先的记忆层,适用于任何LLM,它使用SQLite和petgraph将实体和关系提取到持久化知识图谱中,提供自动上下文注入以增强对话。
SAGE提出了一种用于智能LLM记忆演化的新颖性门控,利用基于von Mises-Fisher的密度估计器来决定是否添加、合并或忽略新事实,在保持记忆质量的同时减少LLM调用。
引入SeqMem-Eval,一种用于序列演化LLM记忆的诊断评估框架,测量超越聚合指标的多个维度,揭示适应性与稳定性之间的权衡。
GroupMemBench是一个新的基准,用于评估多轮对话中LLM代理的记忆能力,揭示了当前记忆系统的缺陷,最佳系统仅达到46%的平均准确率。
这项研究表明,即使基于真实解进行训练,通过蒸馏和巩固循环持续更新 LLM 智能体记忆也会导致性能倒退。研究发现,仅保留情景记忆优于基于文本的巩固,突显了当前自我改进范式的重大缺陷。
一位独立开发者在 Andrej Karpathy 公开相同想法的几周前,就已悄然上线了一套可工作的“LLM Wiki”系统——为语言模型提供持久记忆。
在 Andrej Karpathy 公开“LLM Wiki”想法的一个月前,就有人实现了可运行的系统,解决了 LLM 每次从零开始、没有记忆也无法自我进化的痛点。
研究者推出BEHEMOTH基准与CluE聚类提示优化,使LLM能从多样化任务中抽取并保留异构记忆,相比既往自演化框架提升9%。
Mem0 引入了一种基于图表示的可扩展内存中心架构,旨在提升大语言模型(LLM)在长期对话中的连贯性,在显著降低延迟和 Token 成本的同时,性能优于现有的记忆系统。