智能体记忆不仅仅是基于用户事实的RAG
摘要
文章认为,简单的基于RAG的智能体记忆系统在生产中会失败,原因包括过时的偏好、遗漏的关键词和提示注入等问题,并主张采用分层记忆架构,具备主动选择、确定性回退、治理和测试等功能。
我经常看到智能体记忆的实现方式为:1. 从对话中提取事实/偏好 2. 存储它们 3. 在每次回复前检索top-k 4. 将它们注入到提示中。这种模式在演示中有效,但在生产中会失效,因为记忆一旦进入提示就变成了策略。一个过时的偏好可能是真实的,但对当前任务仍然是错误的。一个后续问题可能省略了原始任务的关键词。一个被编辑的记忆可能保留过时的嵌入。一个选择器故障可能意外导致广泛的提示注入。我所主张的模式是:
- 分层记忆:证据/场景/稳定画像
- 注入前的主动记忆选择
- 确定性回退,从不完整注入
- memory_usage遥测
- 治理:编辑、废弃、合并、取代
- 清理重复污染上下文的记忆的janitor
- 基于真实轨迹的场景回放测试
很好奇其他人如何处理“真实但不应该影响本轮回应的记忆”。为了遵守子版块关于链接的规则,我将在评论中发布完整的文章。
相似文章
关于智能体、RAG 和记忆的一些笔记与经验教训
作者分享了在大规模构建 AI 智能体过程中积累的笔记与经验教训,重点探讨 RAG 和记忆管理,以帮助他人。
rohitg00/agentmemory
agentmemory 是一个开源的持久化记忆层,专为 AI 编程智能体(Claude Code、Cursor、Gemini CLI、Codex CLI 等)设计。它通过知识图谱、置信度评分和混合搜索技术,借助 MCP、Hooks 或 REST API,为智能体提供跨会话的长期记忆能力。该项目基于 iii 引擎构建,无需外部数据库,提供 51 个 MCP 工具。
Agentmemory
Agentmemory 为 Codex、Hermes、OpenClaw 和 Claude 等 AI 模型提供持久记忆,使其能够在交互过程中保持长期上下文。
AI 智能体记忆机制详解(28 分钟阅读)
本文全面介绍了 AI 智能体记忆机制的技术原理,区分了工作记忆与长期记忆的实现方式,并探讨了上下文管理、基于嵌入的检索以及数据生命周期治理等关键策略。
构建 Agentic GraphRAG 系统:从知识图谱和本体论到作为 AI 智能体 MCP 服务器的统一记忆
作者认为 GraphRAG 本质上是一个数据建模问题,而非单纯的检索算法,并提出了一种包含五个组件的架构,利用本体论、知识图谱和 MCP 服务器为智能体提供统一记忆。