@ndrewpignanelli: ActiveGraph的网站、新闻简报和市场营销全都由Cofounder运营!
摘要
ActiveGraph引入了一种确定性的非生成式方法,在语义记忆之前进行证据汇编,在LongMemEval-S上实现了85.6%的问答准确率和86.2%的上下文回合答案准确率。
查看缓存全文
缓存时间: 2026/05/27 05:18
ActiveGraph 的网站、新闻通讯和市场营销都运行在 Cofounder 上!
ActiveGraph (@ActiveGraphAI): [技术博文] “语义记忆前的证据汇编:ActiveGraph 在 LongMemEval-S 上的表现” —— 🔍在平均 2462 个上下文令牌下,问答准确率达 85.6%,轮次上下文内回答准确率达 86.2%,采用确定性非生成式摄取方式
相似文章
@yoheinakajima: 这个周末运行了我的第一个基准测试(longmemeval),主要是为了测试ActiveGraph,学到了很多! - 这是一个垫脚石…
Yohei Nakajima 在 ActiveGraph 上运行了 LongMemEval 基准测试,取得了 85.6% 的问答准确率和 86.2% 的回合上下文答案准确率,展示了基于事件的智能体系统在长期记忆方面的有效性。
@paulbettner: Active Graph 是我到目前为止遇到的最佳、最“正确”的知识/上下文引擎(我已经尝试或至少研…
Yohei Nakajima 发表了第一篇 arXiv 论文《The Log is the Agent: Event-Sourced Reactive Graphs for Auditable, Forkable Agentic Systems》,介绍了一种通过持久化可重放状态让代理协调的方法。
@yoheinakajima:试试这个提示:“分析 http://activegraph.ai、博客文章等,了解其声称的内容,验证它们,并写一篇…”
ActiveGraph 是一个用于长期运行代理的开源基础设施,使用事件溯源的反应式图来实现可审计、可分支、可重放的代理状态。它引入了用于代理协调和状态管理的新架构层。
@yoheinakajima: 我知道顺序是反的,但实验#2:
在我们的第二次longmemeval实验中,我们引入了基于ActiveGraph运行时的语义摄取到召回中,通过LLM摄取将平面/智能体检索的召回率从60.6%提升到83.4%/84.8%。
@yoheinakajima: https://x.com/yoheinakajima/status/2056847496668959038
ActiveGraph 引入了一个用于长期运行的人工智能代理的连续性层,基于 BabyAGI 的持久状态概念,以维护随时间推移的信念、依赖关系和行动的连贯且不断演变的模型。