在多智能体设置中,持久化记忆应该存放在哪里?一个小型研究框架

Reddit r/AI_Agents 论文

摘要

作者提出,在多智能体AI系统中,持久化记忆应该归属于项目所有者,而不是任务专家,这一观点借鉴了咨询公司的实践和关于项目记忆的学术文献。他们提供了一个研究框架,包含模板和评估准则,用于进行现场试验。

在运行了几个月涉及AI智能体的长期项目后(有些项目持续数周,多个专业智能体处理相同的文件),我反复遇到相同的失败模式。专业智能体在其狭窄任务上表现良好,但项目记忆却崩溃了。第一周做出的决定到第四周就遗失了。被否决的选项悄悄复活。'单一真相来源'总是当前打开的聊天窗口。我开始研究那些已经进行了数十年长期工作的地方如何处理这个问题。咨询公司运营持续数月、人员轮换的项目,他们通过转型办公室或项目管理办公室(PMO)来维持:节奏、决策日志、风险登记册、一个规范的当前状态工件、一位参与经理来框定问题并委派工作流。有趣的部分是运营模式,而不是咨询表演。还有相关的学术线索。Kasvi等人(2003)区分了项目记忆(可用于指导当前工作的知识)与项目记忆系统(存储、检索、传播、使用)。Mariano和Awazu(2024)将项目记忆视为一种主动实践而非存储库。在LLM方面,Anthropic的多智能体研究系统、OpenAI Agents SDK的交接模式,以及最近的工作如LEGOMem和AgentSys,都指向了具有层级或模块化记忆的编排者-工作者模式。我提出的假设很狭隘。持久化记忆应该归属于项目所有者。任务专家应接收最小化、限定的上下文。持久化的单位是项目文件夹,而不是对话。一个持久的'项目经理灵魂'维护规范记忆,框定模糊请求,分解工作,为专业智能体编写简洁的交接简报,验证返回的工作,并且只将基于证据的事实写入记忆。该仓库是一个研究框架,而非验证过的结果。它包含一个智能体合约、记忆文件和交接简报的模板、带有来源的咨询工作流图、一个案例研究,以及一个评估准则(重复上下文事件、交接简报长度、决策闭合时间、专业智能体重做循环等)。下一步是在实际项目上进行一周的现场试验,然后再做出任何断言。我最希望收到反馈的是记忆边界。当前规则是专业智能体看不到完整的项目历史,只看到交接简报和它们需要的文件。我不确定这在什么地方会出问题。我怀疑,在专业智能体需要知道之前选项被否决原因的任务中,简报会悄悄增长,直到再次成为完整的记忆。好奇是否有人遇到过这种情况,或者以不同的方式解决了它。
查看原文

相似文章

工作代理是否应直接写入内存?一种我正测试的策展-代理模式

Reddit r/AI_Agents

作者描述了一种模式,其中工作代理不直接写入共享内存,而是发出结构化内存事件,由内存策展人进行验证、去重并路由到适当的作用域,旨在防止多代理系统中的内存污染。他们将此方法与现有框架进行了比较,并征求社区反馈。

智能体的记忆尚未成熟

Reddit r/AI_Agents

对当前AI智能体记忆解决方案的批评,认为RAG包装器及类似方法未能解决模型偏见和上下文膨胀的核心问题。

PREPING: 无需任务的智能体记忆构建

Hugging Face Daily Papers

提出了PREPING,一个在没有任何任务特定经验之前,通过提议者引导的合成实践来构建智能体记忆的框架,实现了有竞争力的性能并降低了部署成本。