memory-management

#memory-management

@wquguru: https://x.com/wquguru/status/2069641926752780384

X AI KOLs Timeline ↗ · 昨天缓存

本文全面梳理了截至2026年中，AI Agent记忆（Memory）的完整架构分层，包括规则文件、常驻画像、历史召回和证据链，阐述了不同层次记忆的存储方式、加载时机和治理原则，强调记忆在帮助Agent实现跨会话复利工作中的关键作用。

0 人收藏 0 人点赞

#memory-management

问题：Hermes 代理应如何处理跨会话的持久化内存？

Reddit r/AI_Agents ↗ · 2026-06-18

社区关于 Hermes 代理应如何处理跨会话持久化内存的讨论，探索外部内存层（8mem），并比较了感知内存与通用输出。

0 人收藏 0 人点赞

#memory-management

@DODOREACH: https://x.com/DODOREACH/status/2067571689634894251

X AI KOLs Timeline ↗ · 2026-06-18 缓存

在使用Hermes Agent三个月后，作者分享了关于内存管理和配置文件优化的见解，发现更少的内存和更少的配置文件会带来更好的结果。

0 人收藏 0 人点赞

#memory-management

llama.cpp - 如何在GPU上释放更多空间

Reddit r/LocalLLaMA ↗ · 2026-06-17

一则讨论如何在llama.cpp中释放GPU内存实用技巧的帖子，例如将mmproj卸载到CPU、调整KV缓存类型，同时讨论了--cache-type-k/v和--spec-draft-n-max等参数。

0 人收藏 0 人点赞

#memory-management

我通过MCP给我的AI代理带来了共享内存——方法如下

Reddit r/AI_Agents ↗ · 2026-06-16

Nexus Memory 是一个原生 MCP 的内存服务器，允许 AI 代理通过统一协议共享上下文，实现跨不同代理的持久化、协调一致的内存，无需自定义集成。

0 人收藏 0 人点赞

#memory-management

GeneralVLA-2：几何感知重建与受控记忆用于机器人规划

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

GeneralVLA-2 引入了 GeoFuse-MV3D 以改进 3D 重建，以及一个受控的 KnowledgeBank 以在机器人操作任务中实现更好的记忆管理，在多个基准测试上取得了性能提升。

0 人收藏 0 人点赞

#memory-management

OPD-Evolver：通过在线策略蒸馏培育整体智能体进化器

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

OPD-Evolver 提出了一种自我进化智能体框架，采用慢-快协同进化与在线策略自蒸馏，以增强记忆管理和策略学习，在多个领域基准测试中优于 ReasoningBank 和 Skill0 等现有方法。

0 人收藏 0 人点赞

#memory-management

@zaimiri: https://x.com/zaimiri/status/2066117404392890835

X AI KOLs Timeline ↗ · 2026-06-14 缓存

一份详细的7天指南，教你搭建Hermes AI代理，涵盖身份、记忆、工具和Telegram集成。

0 人收藏 0 人点赞

#memory-management

Python 3.14 垃圾回收的波折

Hacker News Top ↗ · 2026-06-12 缓存

Python 3.14 引入了一个增量垃圾回收器，但由于内存压力报告，该回收器在 3.14.5 中被回滚。本文解释了这些变化、它们的影响以及围绕回滚的争议。

0 人收藏 0 人点赞

#memory-management

G-Long: 图增强内存管理用于高效长期对话代理

arXiv cs.CL ↗ · 2026-06-12 缓存

G-Long 提出了一种用于长期对话代理的图增强内存管理框架，利用微调的小型语言模型进行结构化三元组提取和关联检索，在响应生成和内存检索方面取得了最先进的性能，同时降低了计算开销。

0 人收藏 0 人点赞

#memory-management

如何防止 llama.cpp 将数据卸载到交换空间？

Reddit r/LocalLLaMA ↗ · 2026-06-11

用户寻求关于如何防止 llama.cpp 在 RAM 完全耗尽前将 KV 缓存卸载到交换空间的建议，并分享了他们在配备 96GB RAM 的 M2 Max 和大型 Qwen 模型上的配置。

0 人收藏 0 人点赞

#memory-management

超越压缩：面向长周期智能体的结构化上下文驱逐

arXiv cs.CL ↗ · 2026-06-11 缓存

介绍了上下文窗口生命周期（CWL），这是一种面向长周期LLM智能体的结构化上下文驱逐方案，通过基于依赖图驱逐内容来维持有效无界的工作视野，避免了基于摘要的压缩和最近截断的局限性。

0 人收藏 0 人点赞

#memory-management

Unix GC 重制版

Hacker News Top ↗ · 2026-06-10 缓存

详解 Linux 内核 AF_UNIX 垃圾收集器的重写，包括背景、新的基于图的模型以及一个释放后使用漏洞。

0 人收藏 0 人点赞

#memory-management

REAL: 一种用于LLMs长期记忆管理的推理增强图框架

arXiv cs.CL ↗ · 2026-06-10 缓存

REAL是一种用于LLMs长期记忆管理的推理增强图框架，它利用时间与置信度感知的有向属性图，采用非破坏性时间更新和混合波束搜索检索，平均性能提升22.72%。

0 人收藏 0 人点赞

#memory-management

更大的上下文窗口对智能体来说其实是错误的方向吗？

Reddit r/AI_Agents ↗ · 2026-06-10

作者质疑将注意力集中在扩大AI智能体的上下文窗口上是否适得其反，认为积累的垃圾信息会拖慢长时间会话，并建议保持工作上下文小巧、使用外部记忆。

0 人收藏 0 人点赞

#memory-management

zalloc: 在你的 C 代码中使用 Zig 分配器

Lobsters Hottest ↗ · 2026-06-08 缓存

zalloc 将 C 模块中的 malloc、calloc、realloc 和 free 替换为 Zig 分配器，从而在 C 代码中实现 Zig 风格的内存管理。

0 人收藏 0 人点赞

#memory-management

一个决定保留/遗忘内容的AI‘记忆管理器’实际上可行吗？

Reddit r/ArtificialInteligence ↗ · 2026-06-05

一位用户质疑基于重要性、强化和衰减来决定保留或遗忘内容的AI记忆管理器系统的可行性。

0 人收藏 0 人点赞

#memory-management

RAMPART：基于注册表的智能体记忆系统，具备优先级感知的运行时转换能力

arXiv cs.CL ↗ · 2026-06-04 缓存

RAMPART 是一种面向基于 LLM 的智能体的编译期内存模型和纯内存块注册表，通过五种可组合的原语管理上下文组装，支持优先级排序与淘汰策略。在多个 7B 至 14B 参数规模模型上的实验表明，块分组、相关性门控和模式淘汰能够显著提升任务成功率并降低提示词 token 开销。

0 人收藏 0 人点赞

#memory-management

SaliMory：面向对话智能体的认知记忆编排框架

arXiv cs.CL ↗ · 2026-06-04 缓存

SaliMory 是一个框架，通过训练单一语言模型来管理对话智能体的认知结构化记忆（包括用户事实、偏好和工作记忆），采用分层阶段式过程奖励与奖励分解对比精化机制。该框架将记忆归因失败率降低了三分之一，端到端准确率超越现有最优方法逾10%，并将良好个性化率提升至原来的两倍以上。

0 人收藏 0 人点赞

#memory-management

AI智能体拥有强大的记忆能力，但毫无记忆卫生可言。六个月后会是什么样？没人谈论这一点。

Reddit r/AI_Agents ↗ · 2026-06-03

探讨了AI智能体中被忽视的记忆卫生问题——长期存储导致上下文过时且不可靠，并质疑行业是否在忽视一个即将到来的全球性问题。

0 人收藏 0 人点赞

memory-management

提交意见反馈