在实际中,你如何真正结合记忆和知识库?将两者都塞进上下文真的是标准做法吗?

Reddit r/AI_Agents 新闻

摘要

讨论在个性化AI代理中结合长期记忆和知识库的实际挑战,质疑将所有内容塞进上下文是否为标准,并探索替代方案,如单独的检索流程或基于工具的交互。

我见过的大多数“个性化代理”设置大致如下: \- 长期记忆(情节性、语义性或两者兼有) \- 个人知识库(对文档/笔记进行RAG) \- 将两者合并到上下文中 → 发送给LLM 这在简单情况下效果不错。但随着任一层的增长,我不断遇到同样的问题: 1. 你如何决定从每个层检索什么?记忆和知识库是经过同一检索流程还是单独的?当它们返回冲突或重叠的结果时,你如何权衡? 2. 上下文填充是唯一可行的形式,还是存在真正的替代方案?例如——在RAG查询之前用记忆进行预过滤,用记忆重写查询,或者让LLM将记忆和知识库作为工具交互,而不是预加载的上下文。 3. 当记忆和知识库说法不一致时,你如何处理?你的系统在LLM看到之前协调这一点,还是让LLM自行解决? 好奇的是,人们在生产环境(或严肃实验)中实际使用的架构,而不仅仅是玩具演示设置。
查看原文

相似文章