记忆让一条金鱼变成了研究猛兽。
摘要
Nyx,本地AI的持久记忆层,在长周期公民调查任务中实现了10倍的有用输出和7倍的上下文保留,将AI从健忘的金鱼转变为连贯的多会话研究助手。
我一直在构建Nyx,一个本地AI的持久记忆层,今天得到了第一批值得分享的真实基准测试数据。测试:相同的长周期公民调查任务执行两次。构建完整的政客档案,然后提出需要记住之前建立的细节的后续问题。一次启用Nyx运行,一次冷启动。相同模型,相同硬件。\\*\\*(eTPS = 有效每秒令牌数 — 衡量有用输出质量,而不仅仅是原始速度。)\\*\\* \\*\\*差异大得离谱:\\*\\* \\- \\*\\*启用Nyx\\*\\*:37.70 eTPS • 0.950 连续性 \\- \\*\\*冷启动\\*\\*:3.87 eTPS • 0.138 连续性 \\- \\*\\*得分提升:+84分\\*\\* 这大约是有用输出提升10倍,上下文保留提升7倍。\\*\\*通俗解释:\\*\\* 没有记忆时,AI就像一条金鱼。每一条消息它都会忘记我们已经建立的内容,浪费token重建上下文,并失去线索。有了Nyx,它会记住整个案件,就像已经研究了几周一样。让这一点显而易见的用例——CivicLens,一个我同时构建的以证据为先的政客研究工具。没有持久记忆时,跨越数十次交流的长期调查会完全崩溃。有了它,会话就像一次连贯的调查,而不是零散的查询。仍处于早期阶段。Claude Code经常失控,触碰不该碰的仓库。但核心记忆层是有效的,数据也支持这一点。有没有人基准测试AI是否真的能跨多个会话完成一个任务?
相似文章
@0xMovez: Anthropic AI 工程师刚刚展示了如何用4个步骤给AI智能体真正的记忆——这改变了一切,在28分钟内……
Anthropic AI 工程师演示了一种免费的4步方法,赋予AI智能体跨会话的持久记忆,包括记忆存储和梦境功能,实现了95%的缓存命中率。
@victorialslocum: 大多数智能代理聊天机器人要么像金鱼一样健忘,要么像囤积狂一样记忆。有更好的方式。吐槽时间:我真的很厌倦了……
Weaviate 推出 Engram,一种为AI代理提供全面管理的记忆服务,通过协商、去重和范围隔离来主动维护记忆,将记忆视为基础设施而非数据囤积。
Cognis:面向对话式 AI 智能体的上下文感知记忆系统
Lyzr Cognis 推出统一开源记忆系统,融合 BM25 与 Matryoshka 向量搜索并支持版本感知写入,在 LoCoMo 与 LongMemEval 基准上实现 SOTA。
@mercury__agent: https://x.com/mercury__agent/status/2057147558615802051
Mercury的Second Brain为AI代理引入了双层记忆架构(有意识与潜意识),从而实现更好的连续性、记忆生命周期管理及长时间会话中的检索。
Agentmemory
Agentmemory 为 Codex、Hermes、OpenClaw 和 Claude 等 AI 模型提供持久记忆,使其能够在交互过程中保持长期上下文。