@yoheinakajima: 我知道顺序是反的,但实验#2:
摘要
在我们的第二次longmemeval实验中,我们引入了基于ActiveGraph运行时的语义摄取到召回中,通过LLM摄取将平面/智能体检索的召回率从60.6%提升到83.4%/84.8%。
查看缓存全文
缓存时间: 2026/06/01 17:46
我知道这是倒序,但实验 #2:https://t.co/vimwT061hZ
ActiveGraph (@ActiveGraphAI): [新技术博客文章] 在我们的第二个 longmemeval 实验中,我们利用 ActiveGraph 运行环境将语义摄入引入召回机制。
我们从 60.6% 的基线开始,通过 LLM 摄入,将平面检索提升至 83.4%,将智能体检索提升至 84.8%。
相似文章
@yoheinakajima: longmemeval 实验架构:1) 确定性摄取/提取(准确率85.6%,检索率86.2%)2) 语义摄取…
该推文分享了 LongMemEval 实验的结果,比较了确定性和语义摄取/提取方法,其中混合方法达到了 87.6% 的准确率和 90.0% 的检索率。
@yoheinakajima: 这个周末运行了我的第一个基准测试(longmemeval),主要是为了测试ActiveGraph,学到了很多! - 这是一个垫脚石…
Yohei Nakajima 在 ActiveGraph 上运行了 LongMemEval 基准测试,取得了 85.6% 的问答准确率和 86.2% 的回合上下文答案准确率,展示了基于事件的智能体系统在长期记忆方面的有效性。
@ndrewpignanelli: ActiveGraph的网站、新闻简报和市场营销全都由Cofounder运营!
ActiveGraph引入了一种确定性的非生成式方法,在语义记忆之前进行证据汇编,在LongMemEval-S上实现了85.6%的问答准确率和86.2%的上下文回合答案准确率。
@dair_ai: // 记忆即模型 // 该论文为任何LLM增加一个单独训练的记忆模型,用于存储、检索和整合…
MeMo 引入了一种模块化记忆模型,可为任何 LLM 增强存储、检索和整合新知识的能力,无需重新训练或担心灾难性遗忘。它在 BrowseComp-Plus、NarrativeQA 和 MuSiQue 等基准测试上优于基于 RAG 的方法。
Cognis:面向对话式 AI 智能体的上下文感知记忆系统
Lyzr Cognis 推出统一开源记忆系统,融合 BM25 与 Matryoshka 向量搜索并支持版本感知写入,在 LoCoMo 与 LongMemEval 基准上实现 SOTA。