智能体记忆是数据库吗?

Reddit r/AI_Agents 论文

摘要

一篇论文认为,智能体记忆不应被视为具有CRUD操作的数据库,提出了受控演化记忆(GEM),采用状态级操作符和主题图数据模型,以解决整合、传播、相关性和适应性问题。

**智能体记忆是数据库吗?** 我们花了一篇论文来回答这个问题。答案是否定的。你使用的每一个AI智能体都有同样的问题。ChatGPT会记住你的偏好,但会把过时的事实当作当前信息呈现。Cursor会学习你的代码库,但随着上下文增长,它会丢失早期的决策。你不得不重复解释系统已经知道的事情。你为此支付不断增长的推理成本。根本原因比LLMs更古老。智能体记忆继承了传统数据库的CRUD。创建、读取、更新、删除。这些操作作用于单个记录。但记忆的正确性并不是任何单个记录的特性。它存在于整个状态如何随时间演化。CRUD在四个方面具体失效。**#创建无法整合**。新事实被附加到旧事实旁边,而不是合并。**#更新无法传播**。更改一个截止日期,所有依赖的事实就会不同步。**#删除无法调节相关性**。记忆按年龄淘汰,所以你最常用的事实因老化被移除,而“讨论过的午餐偏好”却存活下来。**#读取无法适应**。检索返回一个事实但从不强化它,因此频繁访问的知识与陈旧杂乱的内容在同等条件下竞争。更大的上下文窗口无法解决这个问题。更好的检索也无法解决这个问题。差距在于操作本身。所以我们替换了它们。受控演化记忆(GEM)用四个状态级操作符替换了记录级CRUD。**#摄入**将新输入整合到现有记忆中,而不是盲目追加。**#修订**协调重叠的事实,并沿着类型化依赖传播变更。**#遗忘**根据相关性而非年龄衰减内容,同时保持历史可恢复。**#检索**变成一次写入。每次读取都会强化你所访问的内容,因此重要的事实保持突出,陈旧的事实逐渐消失。六个正确性条件约束着状态的演化。我们证明,无论存储模型如何,任何基于CRUD的系统都无法满足这些条件。然后我们构建了**#MemState**,一个基于属性图引擎的工作原型,以证明它在当今是可行的。核心是一个新数据模型:主题图。每个主题是一个自包含的单元,容纳一个概念的每个字段,每个字段保持完整的值历史,因此更新的截止日期会取代旧的,而不是擦除它。主题通过类型化边连接。扩展边承载真实的依赖,因此修订只传播到变更实际带来的地方。关联边连接相关主题以提供上下文,而不强制传播。实体粒度图将一个概念分散到多个节点;主题图保持其完整性并使依赖关系明确。长期智能体记忆不是一个数据库问题。它是一个新的数据管理工作负载。它值得拥有自己的基础。
查看原文

相似文章

智能体记忆不仅仅是基于用户事实的RAG

Reddit r/AI_Agents

文章认为,简单的基于RAG的智能体记忆系统在生产中会失败,原因包括过时的偏好、遗漏的关键词和提示注入等问题,并主张采用分层记忆架构,具备主动选择、确定性回退、治理和测试等功能。

智能体记忆:剖析

Hacker News Top

探讨智能体记忆库的组件与设计决策,澄清认知科学术语与工程实现之间的差距。