标签
作者认为,AI代理的记忆应侧重于数据剪枝而非囤积,借鉴人类记忆类型(感觉记忆、短期记忆、长期记忆),并指出模仿人类记忆可以在减少令牌用量的同时维持高质量上下文。
一项针对主要AI Agent Harness(Claude Code、Codex、Copilot等)中记忆实现的调查揭示了常见的边界故障,包括有界本地存储、关键词检索、Harness作用域、弱陈旧性处理以及57-71%的跨用户污染率,凸显了Agent记忆基础设施中尚未解决的问题。
探讨了在AI智能体中,将内存从一项功能转变为关键基础设施的转变,强调了检查、修正和信任方面的长期挑战。
一篇博客文章,探讨了Rust中Pretty Printer实现的新设计,解决了将函数式编程研究适应到没有垃圾回收的系统语言中的挑战,并比较了现有的方法,比如'pretty' crate和Oppen风格的Pretty Printer。
本文批评AI行业专注于改进推理层,却忽视了内存管理和基础设施,导致生产环境频频失败。
本文将上下文蒸馏表述为一个潜在记忆管理问题,提出一个框架,将蒸馏后的上下文存储为独立的LoRA适配器,并通过检索、路由和自门控机制来提高鲁棒性和效率。
这篇文章强调了AI记忆在六个月后变得不可靠的问题,出现矛盾和信息摘要漂移,并质疑业界是否专注于增加存储容量而非提升可维护性。
这篇文章解释了 AI 智能体实际上并不会随时间推移而变笨;相反,它们的底层记忆会因存储的假设、摘要和矛盾而积累损坏的上下文,导致性能下降。大多数系统缺乏修订或遗忘信息的能力,从而引发衰退。
记忆策展代理模式将记忆治理与工作代理分离,通过专门的代理评估并将记忆事件路由到适当的作用域,从而提高持久记忆的质量和相关性。
作者分享了构建持续性使用的个人健康代理所面临的挑战,重点讨论了长期记忆管理和可靠性问题,包括在综合多个来源的数据时出现的幻觉现象。
关于管理AI系统中代理记忆的实际挑战的讨论,侧重于避免信息过载导致输出质量下降,并提出使用工作流状态和多代理架构等策略。
KV cache 在自回归生成过程中存储先前计算的键向量和值向量,使模型能够避免在每一步重新计算整个序列,从而显著加速推理,但代价是内存使用增加。
作者认为“代理记忆”是错误的首要框架,因为它混淆了工作状态和持久记忆,导致调试问题。作者主张将混乱的工作状态(应过期)与具有来源和权威的严格持久记忆分开。
作者描述了一种模式,其中工作代理不直接写入共享内存,而是发出结构化内存事件,由内存策展人进行验证、去重并路由到适当的作用域,旨在防止多代理系统中的内存污染。他们将此方法与现有框架进行了比较,并征求社区反馈。
讨论了AI代理积累不可编辑记忆的关键问题,导致调试不可能,并提出疑问是否有人解决了这个问题。
本文重点讨论了随时间推移管理 AI 智能体记忆时日益严重的问题:用户花费更多精力维护上下文,而非实际使用智能体。文章指出,目前缺乏用于记忆衰减和治理的基础设施。
本文介绍了 Linux 内核交换子系统的最新改进和未来计划,包括减少每页开销、基于 folio 的辅助函数,以及使交换更适配固态存储的努力。相关内容在 2026 年 Linux 存储、文件系统、内存管理与 BPF 峰会上进行了讨论。
一篇系统编程入门文章,涵盖诸如位操作、解析、文件系统、系统调用和内存管理等基础知识,面向程序员。
文章认为,简单的基于RAG的智能体记忆系统在生产中会失败,原因包括过时的偏好、遗漏的关键词和提示注入等问题,并主张采用分层记忆架构,具备主动选择、确定性回退、治理和测试等功能。