@Michaelzsguo:今天我将我的Hermes代理升级为TencentDB Agent Memory。我没有将其连接到云端LLM,而是将其连接到了…
摘要
作者使用本地Qwen 3.5-4B模型通过llama-server运行,将其Hermes代理升级为TencentDB Agent Memory,用于结构化JSON提取和多步骤工具调用,实现了一个基于游标检查点的弹性分层记忆流水线。
查看缓存全文
缓存时间: 2026/05/24 22:38
今天,我用 TencentDB Agent Memory 升级了我的 Hermes 智能体。
我没有把它连接到云端大模型,而是通过 llama-server 把它对接到了本地 MacBook Pro 上运行的通义千问 3.5-4B(Qwen 3.5-4B)模型上。
效果非常棒。
TencentDB Agent Memory 是一款设计非常出色的产品。它采用分层记忆结构:
- L0:原始日志,存储在 SQLite + JSONL 中
- L1:类型化 JSON 记忆提取
- L2:场景块,以 Markdown 叙事片段形式组织
- L3:人物画像合成与交互协议
除了 L0 层,每一层都需要一个大语言模型来提取和合成信息。
在 L1 层,模型将对话解析为类型化的记忆 JSON,包括:人物事实、情景事件和指令。 在 L2 层,模型通过工具调用(如 read、write、edit)将记忆组织成主题性的 Markdown 叙述。 在 L3 层,模型读取所有场景,生成一致的用户画像及交互协议。
每一层都支持基于游标的检查点机制。因此即使本地模型宕机,也不会丢失任何数据。管线会从最后处理过的游标位置继续执行。
为什么选择 Qwen 3.5-4B?
这是我找到的能可靠胜任该架构所需两项任务的最小模型:结构化 JSON 提取与多步工具调用。Qwen 2.5-3B 在这个场景下太脆弱了。而 Qwen 3.5-4B 恰好处于本地推理的最佳平衡点。
相似文章
@bayendor: 刚刚完成将三层记忆栈接入Hermes Agent。第一层:Honcho Session + PostgreSQL上的对等记忆。处…
描述了为Hermes Agent实现一个三层记忆栈,结合了PostgreSQL上的会话记忆、带有模式脱敏的工作记忆以及使用PGLite的长期知识图谱。
@verysmallwoods: 腾讯开源的 TencentDB-Agent-Memory,实现4层记忆系统。 https://open.substack.com/pub/verysmallwoods/p/tencentdb-agent-memory-openclaw-h…
腾讯开源了TencentDB-Agent-Memory,实现了四层记忆系统,支持通过OpenClaw插件集成并提供Hermes的Docker化方案,将PersonaMem准确率从48%提升至76%。
@smykx:上个月我写了一篇博文,探讨了 @NousResearch 开发的 Hermes-Agent 的内存底层机制,链接在回复中。
作者分享了一篇博文,详细介绍了由 Nous Research 开发的 Hermes-Agent 框架的内存底层机制。
@KSimback: https://x.com/KSimback/status/2058262328496554021
一份关于Hermes Agent记忆系统的全面指南,解释了三层记忆架构,并比较了各种记忆工具和提供商。
@mr_r0b0t: 如果你的设备拥有24-128GB统一内存,并且使用@NousResearch Hermes agents,那么这正适合你!你现在可以运行完全本地的智能体团队…
宣布在拥有24-128GB统一内存的系统上,可以使用NousResearch Hermes agents运行完全本地的智能体团队。每个智能体都有独立的Hermes会话,并通过本地协调器在长时间运行的任务上协同工作。