@hasantoxr: 我要用这个替换掉我给智能体搭建的所有记忆层。SureThing 在 LongMemEval 上刷新了 SOTA。88.0% …
摘要
SureThing 在 LongMemEval 基准测试中取得了最先进的结果,综合得分达到 88.0%,促使开发者用其替换现有 AI 智能体中的记忆层。
我要用这个替换掉我给智能体搭建的所有记忆层。SureThing 在 LongMemEval 上刷新了 SOTA。综合得分 88.0%。知识更新得分 91.0%。单会话偏好得分 76.7%。在所有真正重要的类别中均位列第一。随后,他们自己的 AI 走到屏幕前,开始自行解释这一切。没人要求它这么做。
相似文章
在 LongMemEval-S 上对智能体记忆检索进行基准测试 — Recall@5 达 98%,R@23 实现 100% 召回,仅依赖本地嵌入模型 (all-MiniLM-L6-v2),无需 LLM 与 API Key
作者分享了用于智能体记忆的 Python 库 memweave 的基准测试结果,该库仅使用本地嵌入且无需调用 LLM,便在 LongMemEval-S 上实现了 98% 的 Recall@5。本文详细介绍了实现方法,并与 mempalace 进行了性能对比,突出了其在不同问题类型上稳定的检索表现。
MemoryOS —— 具备时序知识图谱的 AI 智能体记忆,实现 9ms 摄取与 78ms 检索
MemoryOS 是一款开源、可自托管的 AI Agent 记忆工具,它利用时序知识图谱技术,在 LongMemEval-s 基准测试中实现了 86.2% 的准确率,并以 78 毫秒的快速检索速度著称。
Mem0:利用可扩展的长期记忆构建生产就绪的 AI 智能体
Mem0 引入了一种基于图表示的可扩展内存中心架构,旨在提升大语言模型(LLM)在长期对话中的连贯性,在显著降低延迟和 Token 成本的同时,性能优于现有的记忆系统。
@oliviscusAI:有人开源了一个记忆层,在性能上击败了全球所有的RAG系统,名为Memvid。在LoCoMo上SOTA提升35%……
一款名为Memvid的新型开源记忆层宣称超越所有现有RAG系统,在LoCoMo上实现SOTA提升35%,多跳推理提升76%,并打包为单个.mv2文件。
rohitg00/agentmemory
agentmemory 是一个开源的持久化记忆层,专为 AI 编程智能体(Claude Code、Cursor、Gemini CLI、Codex CLI 等)设计。它通过知识图谱、置信度评分和混合搜索技术,借助 MCP、Hooks 或 REST API,为智能体提供跨会话的长期记忆能力。该项目基于 iii 引擎构建,无需外部数据库,提供 51 个 MCP 工具。