标签
一篇文章讨论了AI智能体为何经常重复犯错,因为其记忆检索机制更注重语义相似性而非有效性,导致有缺陷的决策。
ConvMemory v3 引入了一个有效性上下文层,通过目标条件双证据门检测过时或被取代的对话记忆,在合成基准上实现了高准确率,并零样本迁移到角色绑定任务。
PrecisionMemBench 是一个开源基准测试,它将检索精度作为严格的单元测试来检验,结果揭示了诸如 Mem0、Zep 和 Hindsight 等流行的记忆框架精度极低(0.05-0.09),并且依赖 LLM 来弥补。文章主张在生产级记忆基础设施中对精度采取零容忍的硬失败策略。
本文提出了一种针对长上下文对话系统中记忆访问与选择的统一框架,利用贝叶斯因子量化历史轮次对建模变化用户偏好的效用。实验表明,在偏好密集型任务中,该框架优于基于嵌入的检索方法。
SSRN上的一篇预印本介绍了PHI // DRIFT,这是一种用于AI伴侣的认知中间件架构,具有持久内部状态和显著性加权记忆检索,声称在消费级硬件上每个提示比仅余弦RAG多14.8%的上下文。
H-Mem是一种面向基于LLM的智能体的新型记忆机制,采用时间-语义树与知识图谱相结合的混合结构,以建模记忆演化并提升检索性能,在问答基准上实现了最先进水平。
一个受情景记忆理论启发的新型内存检索系统,使用Gemini Flash在LongMemEval基准测试中取得了最先进的96.4% top-50准确率,通过将检索质量与模型能力分离,超越了基于Pro的大型基线。
本文介绍了 PYTHALAB-MERA,这是一种用于冻结本地大语言模型(LLM)的外部控制器,通过基于验证的记忆和检索机制来提升代码代理的性能。与自我修正基线方法相比,该方法利用执行反馈和时间差分学习,在严格验证任务中展现出更高的成功率。
HAGE引入了一种加权多关系记忆框架,能够在统一关系记忆图上实现查询条件化的遍历,通过自适应记忆检索和基于强化学习的优化来提高长程推理准确性。
作者介绍了 Tiro,这是一个开源的智能体内存和检索框架,旨在通过为会话、文档和运行状态提供模块化且可检查的内存通道,解决 LLM 智能体中的长期上下文漂移问题。
银联研究人员提出 SCG-MEM,一种模式约束的生成式记忆架构,通过强制 LLM 仅在动态认知模式内解码有效记忆键,消除结构性幻觉,在 LoCoMo 基准上全面超越稠密检索基线。