我构建了一个智能体记忆层,每次回答都返回一个“证明树”——它知道什么、何时知道以及为什么
摘要
一个面向AI智能体的全新托管API记忆层,每次回答都返回一个证明树,包括双时态版本控制、审计追踪和哈希验证,在LongMemEval-S上达到80.2%准确率,并公开透明的基准测试结果。
我花了一段时间构建这个,想与真正运行智能体的人分享。思路是:大多数记忆层给你的智能体一个答案,而你只能选择相信。当回忆出错时,你无法看到它为何浮现出这些信息。我希望记忆能提供每个答案的“收据”——具体使用的记忆、每条记忆何时为真(双时态)、什么被取代了,以及一个哈希,让你能判断是否有任何变化。
目前可行的功能:
- pip install aurra / npm install aurra
- 双时态版本控制(查询过去任何时间点的记忆状态)
- 每条记忆的审计追踪(提取模型、来源、历史)
- 多租户隔离
- 自带LLM(BYO-LLM)——传入你自己的提供商密钥,成本仍由你承担
目前是托管API;自托管已在路线图中,尚未实现。基准测试公开,包含方法学和原始数据(LongMemEval-S平均80.2%;最弱类别33.9%,我主动披露这一点,因为整个重点就是对它能做什么和不能做什么保持诚实)。
真心希望从构建智能体的人那里得到反馈——在你的使用场景中,这个方案会在哪里失效?还缺少什么?
相似文章
大家是如何处理 AI 智能体的长期记忆 + 回放/调试问题的?
一位开发者探讨了当前 AI 智能体记忆系统的局限性,并提出了一款具有片段存储和回放调试功能的新记忆层工具,希望获得社区的验证。
rohitg00/agentmemory
agentmemory 是一个开源的持久化记忆层,专为 AI 编程智能体(Claude Code、Cursor、Gemini CLI、Codex CLI 等)设计。它通过知识图谱、置信度评分和混合搜索技术,借助 MCP、Hooks 或 REST API,为智能体提供跨会话的长期记忆能力。该项目基于 iii 引擎构建,无需外部数据库,提供 51 个 MCP 工具。
我总在会话之间丢失智能体记忆,所以我构建了一个记忆中介:它隔离每个智能体的记忆并在重启后保留
作者构建了 HeurChain,这是一款记忆中介,为AI智能体提供特定于智能体的持久化记忆存储,能够在重启后保留记忆,并支持结构化和语义检索。
我们构建了一个面向AI代理的托管内存API(开源SDK + AGM风格的信念修正,用于处理矛盾)
XTraceAI推出了一个面向对话式AI代理的托管内存API,其特色是开源SDK(xmem),该SDK采用AGM风格的信念修正来处理矛盾并自动提取事实。它使用PostgreSQL和pgvector进行语义检索,支持多租户隔离,使开发者能够将内存管理外包出去。
@hasantoxr: 我要用这个替换掉我给智能体搭建的所有记忆层。SureThing 在 LongMemEval 上刷新了 SOTA。88.0% …
SureThing 在 LongMemEval 基准测试中取得了最先进的结果,综合得分达到 88.0%,促使开发者用其替换现有 AI 智能体中的记忆层。