记忆让一条金鱼变成了研究猛兽。

Reddit r/artificial 2026/05/19 21:19 工具

memory-layer local-ai context-retention benchmark ai-tool civic-tech

摘要

Nyx，本地AI的持久记忆层，在长周期公民调查任务中实现了10倍的有用输出和7倍的上下文保留，将AI从健忘的金鱼转变为连贯的多会话研究助手。

我一直在构建Nyx，一个本地AI的持久记忆层，今天得到了第一批值得分享的真实基准测试数据。测试：相同的长周期公民调查任务执行两次。构建完整的政客档案，然后提出需要记住之前建立的细节的后续问题。一次启用Nyx运行，一次冷启动。相同模型，相同硬件。\\*\\*(eTPS = 有效每秒令牌数 — 衡量有用输出质量，而不仅仅是原始速度。)\\*\\* \\*\\*差异大得离谱：\\*\\* \\- \\*\\*启用Nyx\\*\\*：37.70 eTPS • 0.950 连续性 \\- \\*\\*冷启动\\*\\*：3.87 eTPS • 0.138 连续性 \\- \\*\\*得分提升：+84分\\*\\* 这大约是有用输出提升10倍，上下文保留提升7倍。\\*\\*通俗解释：\\*\\* 没有记忆时，AI就像一条金鱼。每一条消息它都会忘记我们已经建立的内容，浪费token重建上下文，并失去线索。有了Nyx，它会记住整个案件，就像已经研究了几周一样。让这一点显而易见的用例——CivicLens，一个我同时构建的以证据为先的政客研究工具。没有持久记忆时，跨越数十次交流的长期调查会完全崩溃。有了它，会话就像一次连贯的调查，而不是零散的查询。仍处于早期阶段。Claude Code经常失控，触碰不该碰的仓库。但核心记忆层是有效的，数据也支持这一点。有没有人基准测试AI是否真的能跨多个会话完成一个任务？

查看原文

记忆让一条金鱼变成了研究猛兽。

相似文章

@0xMovez: Anthropic AI 工程师刚刚展示了如何用4个步骤给AI智能体真正的记忆——这改变了一切，在28分钟内……

@victorialslocum: 大多数智能代理聊天机器人要么像金鱼一样健忘，要么像囤积狂一样记忆。有更好的方式。吐槽时间：我真的很厌倦了……

Cognis：面向对话式 AI 智能体的上下文感知记忆系统

@mercuryagent: https://x.com/mercuryagent/status/2057147558615802051

Agentmemory

提交意见反馈