@akshay_pachaar: Hermes 智能体的三层记忆。AI 智能体会在会话结束后忘记一切,但 Hermes 不会。它拥有三…

X AI KOLs Following 工具

摘要

Hermes 智能体的三层记忆系统结合了始终存在的小型 Markdown 文件、基于 SQLite+FTS5 的全文会话搜索以及可插拔的外部提供程序,为 AI 智能体提供持久且经过精心筛选的记忆,每次交互都会进行组合。

Hermes 智能体的三层记忆。AI 智能体会在会话结束后忘记一切,但 Hermes 不会。它拥有三层记忆层,每层速度不同。 𝘁𝗶𝗲𝗿 𝟭: 𝘁𝘄𝗼 𝘁𝗶𝗻𝘆 𝗺𝗮𝗿𝗸𝗱𝗼𝘄𝗻 𝗳𝗶𝗹𝗲𝘀 MEMORY.md (2200 字符) 和 USER.md (1375 字符)。在会话开始时作为冻结快照注入系统提示中。MEMORY.md 存储项目约定、工具特性和经验教训。USER.md 存储您的个人资料:姓名、沟通风格、技能水平。这些文件故意很小。当 MEMORY.md 容量达到约 80% 时,智能体会进行整合:合并相关条目、删除冗余、只保留最密集的事实。对记忆施加自然选择压力。文件保持小巧,但内部内容随时间变得更加精炼。 𝘁𝗶𝗲𝗿 𝟮: 全文会话搜索(SQLite + FTS5)每次对话都会存储在带有 FTS5 索引的 SQLite 中。智能体可以按需搜索过去数周的会话。当智能体调用 session_search 时:FTS5 在 10,000+ 文档中约 10 毫秒内对匹配项进行排名,LLM 总结最佳结果,并将简洁的结果返回到上下文中。第一层始终存在但很小。第二层容量无限但需要主动搜索。关键事实存在于记忆中,其他所有内容均可搜索。 𝘁𝗶𝗲𝗿 𝟯: 外部记忆提供程序 8 个可插拔的提供程序,与第一层和第二层并行运行,永不替换它们。三个值得了解的:Honcho(辩证用户建模,12 个身份层)、Holographic(本地优先,HRR 向量,无外部调用)和 Supermemory(上下文围栏,防止同一事实被无限次重新存储)。激活后,Hermes 自动同步每次交互:预取在前,同步在后,在会话结束时提取。 𝗵𝗼𝘄 𝘁𝗵𝗲𝘆 𝗰𝗼𝗺𝗽𝗼𝘀𝗲 𝗶𝗻 𝗮 𝘀𝗶𝗻𝗴𝗹𝗲 𝘁𝘂𝗿𝗻 这是大多数人忽略的部分。这些层次在每次交互中通过一个五步循环进行组合:1. 交互开始。第一层已在提示中,第三层预取并前置。2. 智能体使用所有三层作为上下文进行响应。3. 定期提示触发(约每 300 秒)。智能体反思:“是否发生了值得持久化的事情?”如果是,则写入;如果否,则静默返回。4. 记忆写入磁盘上的 MEMORY.md。此会话期间不可见,因为前缀缓存保持热状态。5. 会话关闭。第二层记录对话记录,第三层提取语义。下一个会话以新状态开始。 当前的智能体记忆要么始终在线但浅显(将所有内容塞进提示中),要么深入但被动(矢量存储在关键时刻从不触发)。Hermes 将两者结合:小型始终存在的文件用于关键事实,全文搜索用于深度回忆,外部提供程序用于语义建模,全部由一个自主决定哪些值得保存的提示来编排。智能体不只是存储记忆,而是在压力下策展它们。我撰写了一篇深度文章(见下文),涵盖了 Hermes 智能体的记忆系统、自我进化技能、GEPA 优化,以及如何在您的机器上设置多个专门的智能体。
查看原文

相似文章

Agentmemory

Product Hunt

Agentmemory 为 Codex、Hermes、OpenClaw 和 Claude 等 AI 模型提供持久记忆,使其能够在交互过程中保持长期上下文。