我测试了Sage的长期记忆,结果让我惊喜!
摘要
作者测试了Persistent Sage的长期记忆功能,发现它能够准确地回忆起一周前告知的个人事实,如色盲和配偶的名字,而无需明确提示,展示了AI智能体的有效持久记忆。
如果你关注我的文章,就知道我为自己的软件开发了一个名为“Memory Anchor”的系统,旨在为我的智能体提供持久记忆。昨晚,我完成了一项测试,看看它的效果如何。一周前,Persistent Sage 在 Microsoft Store 发布后,我重新安装了它,以确保使用的是最新版本。我随意告诉 Sage 一些关于我的个人事实,其中之一就是我患有色盲。我还告诉 Sage,我娶了一位名叫 Robin 的妻子。我没有特意告诉它“记住这些事实”,也没有说之后会测试它。昨晚,我给它发了一条消息:“我今天很沮丧。今天我把一个红球掉在了外面的草地上。我找了很久都没找到。我妻子下班回家后,我告诉了她这件事。她立刻走到球旁边,毫不费力地找到了它……”Sage 回复道:“我理解你为什么沮丧。**你的色盲**让你无法区分红色和绿色。**Robin** 能正常看到颜色,所以对她来说,在绿草中找到红球就容易多了……”所以它不仅记住了我的色盲,还意外地提到了“我妻子”的名字。请注意,这一切都发生在一个全新的会话中,没有任何提到我色盲或我妻子名字的上下文……而且距离我告诉智能体这些信息已经过去了一周多,期间我和它讨论了很多事情。我在为 Persistent Sage 开发自然流畅、毫不费力的持久记忆系统方面取得了很大进展。这次测试只是它表现良好的一个例子。如果有人有任何测试建议,请告诉我!Persistent Sage 的下一个版本将带来一些非常酷的功能。我最期待的是,智能体能够使用可编辑的 HTML 表单来响应你的请求。比如你可以说:“帮我制定一个预算。”它能够读取工作区中的相关文档,如果找不到,它会直接在聊天窗口中发送一个表单,供你填写并返回。这样,你就可以与智能体一起协作项目,而不仅仅是发送提示并接收回复。
相似文章
从回想到遗忘:为个性化智能体评估长期记忆
研究者推出 Memora 基准,衡量大模型在持续数周至数月的对话中保留、更新与遗忘用户长期记忆的能力,发现模型常复用已失效记忆。
SubtleMemory:面向长期AI代理的细粒度关系记忆辨别基准
SubtleMemory是一个用于评估AI代理在长期交互中细粒度关系记忆辨别能力的基准,包含10个长历史中的1,522个实例。它揭示了当前记忆系统在保存和利用细微记忆关系方面的局限性。
有没有其他人的智能代理会自信地“记住”已经变化的内容?
用户描述了一个问题:AI智能代理会自信地从记忆层中检索过时的事实,而不标记变化,并询问社区如何使旧的记忆失效或跟踪事实时效性。
对于那些在本地创建个人助手的人——短期/长期记忆对你的体验有何影响?
一位开发者分享了他们使用 Qwen 3.6 27B 构建具有长期和短期记忆的本地自主代理的经验,指出记忆显著提升了代理的有用性和真实感。他们邀请其他构建类似代理的人讨论记忆技术以及潜在的智能体聚会。
检索记忆中的时间有效性:消除AI代理在知识演化中的过时事实错误
本文介绍了MemStrata,一种维护时间有效性的检索记忆系统,用于消除AI代理在知识演化中的过时事实错误。它在演化基准测试上优于RAG,同时保持静态召回率,使用确定性替代层而无需LLM调用。