我曾以为智能体记忆只是存储问题。现在我不这么认为了。
摘要
一位开发者重新思考智能体记忆,认为它不仅仅是存储,而是提出了一个带有角色和激活场的活图,用以赋予过去信息适当的权威和上下文。
我曾以为智能体记忆的难点在于把正确的信息保存在某个地方。markdown、向量搜索、摘要、事件日志等等。只要智能体以后能找到这个笔记,我就觉得那是“记忆”。
烦人的部分后来出现了。旧笔记以与新鲜决策相同的信心回归。临时任务状态开始表现得像长期真理。三个会话前的猜测会和实际修正一起被检索出来,模型必须想办法弄清楚哪一个有权威。这就是我觉得整个事情不对劲的地方。不是因为检索失败,而是因为检索过于扁平化。
记忆层需要的不仅仅是存储。它需要角色。
- 修正应该能够削弱它所修正的内容
- 临时笔记应该过期
- 未完成的任务应该吸引注意力
- 决策应该约束未来的计划
- 过时的计划应该以过时的状态回来,而不是作为金科玉律
改变我思维模式的一点是,将记忆视为一个活的图,而不是一个文件夹。事实、决策、任务状态、修正、痕迹和临时上下文成为不同的节点/边。然后,不是将 top-k 的块倾倒给模型,而是渲染当前情况周围的活跃邻域。而且这个图不应该仅仅作为存储存在。它应该更像一个激活场:一些记忆被唤醒,附近的上下文亮起,过时的链接逐渐消失,强化的路径变得更强,当修正出现时,旧计划可能失去权威。
这听起来很抽象,但实际的区别非常简单:召回不再是“检索最相似的块”,而是变成“记忆图的哪一部分当前活跃,每个记忆被允许做什么?”
我还在摸索这一点,但这让我怀疑,智能体记忆更少是关于找到更多的过去信息,而是关于在信息返回时给予它适当的权威。有人遇到过这个问题吗?你们是如何处理过时计划/修正/临时任务状态,而不让记忆变成一个大闹鬼的搜索框的?
相似文章
智能体记忆应该有动词,而不仅仅是存储
本文批评了当前将智能体记忆仅仅视为存储问题的框架,认为记忆应具有类型化角色、新鲜度和权威级别,以防止过时或错误的信息被当作真理。
智能体记忆是数据库吗?
一篇论文认为,智能体记忆不应被视为具有CRUD操作的数据库,提出了受控演化记忆(GEM),采用状态级操作符和主题图数据模型,以解决整合、传播、相关性和适应性问题。
智能体记忆不仅仅是基于用户事实的RAG
文章认为,简单的基于RAG的智能体记忆系统在生产中会失败,原因包括过时的偏好、遗漏的关键词和提示注入等问题,并主张采用分层记忆架构,具备主动选择、确定性回退、治理和测试等功能。
开始思考“代理记忆”是错误的首要框架
作者认为“代理记忆”是错误的首要框架,因为它混淆了工作状态和持久记忆,导致调试问题。作者主张将混乱的工作状态(应过期)与具有来源和权威的严格持久记忆分开。
智能体记忆:剖析
探讨智能体记忆库的组件与设计决策,澄清认知科学术语与工程实现之间的差距。