记忆让一条金鱼变成了研究猛兽。

Reddit r/artificial 工具

摘要

Nyx,本地AI的持久记忆层,在长周期公民调查任务中实现了10倍的有用输出和7倍的上下文保留,将AI从健忘的金鱼转变为连贯的多会话研究助手。

我一直在构建Nyx,一个本地AI的持久记忆层,今天得到了第一批值得分享的真实基准测试数据。测试:相同的长周期公民调查任务执行两次。构建完整的政客档案,然后提出需要记住之前建立的细节的后续问题。一次启用Nyx运行,一次冷启动。相同模型,相同硬件。\\*\\*(eTPS = 有效每秒令牌数 — 衡量有用输出质量,而不仅仅是原始速度。)\\*\\* \\*\\*差异大得离谱:\\*\\* \\- \\*\\*启用Nyx\\*\\*:37.70 eTPS • 0.950 连续性 \\- \\*\\*冷启动\\*\\*:3.87 eTPS • 0.138 连续性 \\- \\*\\*得分提升:+84分\\*\\* 这大约是有用输出提升10倍,上下文保留提升7倍。\\*\\*通俗解释:\\*\\* 没有记忆时,AI就像一条金鱼。每一条消息它都会忘记我们已经建立的内容,浪费token重建上下文,并失去线索。有了Nyx,它会记住整个案件,就像已经研究了几周一样。让这一点显而易见的用例——CivicLens,一个我同时构建的以证据为先的政客研究工具。没有持久记忆时,跨越数十次交流的长期调查会完全崩溃。有了它,会话就像一次连贯的调查,而不是零散的查询。仍处于早期阶段。Claude Code经常失控,触碰不该碰的仓库。但核心记忆层是有效的,数据也支持这一点。有没有人基准测试AI是否真的能跨多个会话完成一个任务?
查看原文

相似文章

Agentmemory

Product Hunt

Agentmemory 为 Codex、Hermes、OpenClaw 和 Claude 等 AI 模型提供持久记忆,使其能够在交互过程中保持长期上下文。