@Michaelzsguo：今天我将我的Hermes代理升级为TencentDB Agent Memory。我没有将其连接到云端LLM，而是将其连接到了…

X AI KOLs Timeline 2026/05/24 21:15 新闻

local-llm agent-memory tencentdb qwen hermes-agents llama-server structured-extraction

摘要

作者使用本地Qwen 3.5-4B模型通过llama-server运行，将其Hermes代理升级为TencentDB Agent Memory，用于结构化JSON提取和多步骤工具调用，实现了一个基于游标检查点的弹性分层记忆流水线。

今天我将我的Hermes代理升级为TencentDB Agent Memory。我没有将其连接到云端LLM。相反，我通过llama-server将其连接到了本地MacBook Pro上运行的Qwen 3.5-4B。效果很好。 TencentDB Agent Memory是一个设计非常出色的产品。它使用分层记忆栈： L0 原始日志，存储在SQLite + JSONL中 L1 类型化JSON记忆提取 L2 场景块，作为Markdown叙述 L3 角色合成与交互协议除L0外，每个层都需要一个LLM来提取和合成信息。在L1层，LLM将对话解析为类型化记忆，以JSON格式呈现：角色事实、情节事件和指令。在L2层，LLM使用工具调用（如读取、写入和编辑）将记忆组织成主题性Markdown叙述。在L3层，LLM读取所有场景，生成包含交互协议的连贯用户画像。每个层都有基于游标的检查点，因此如果本地模型宕机，不会丢失任何数据。流水线从最后一个处理过的游标处恢复。为什么选择Qwen 3.5-4B？这是我找到的能够可靠处理该架构所需两项任务的最小模型：结构化JSON提取和多步骤工具调用。Qwen 2.5-3B对于这种设置过于脆弱。Qwen 3.5-4B恰好满足了本地推理的最佳平衡点。

查看原文

查看缓存全文

缓存时间: 2026/05/24 22:38

今天，我用 TencentDB Agent Memory 升级了我的 Hermes 智能体。

我没有把它连接到云端大模型，而是通过 llama-server 把它对接到了本地 MacBook Pro 上运行的通义千问 3.5-4B（Qwen 3.5-4B）模型上。

效果非常棒。

TencentDB Agent Memory 是一款设计非常出色的产品。它采用分层记忆结构：

L0：原始日志，存储在 SQLite + JSONL 中
L1：类型化 JSON 记忆提取
L2：场景块，以 Markdown 叙事片段形式组织
L3：人物画像合成与交互协议

除了 L0 层，每一层都需要一个大语言模型来提取和合成信息。

在 L1 层，模型将对话解析为类型化的记忆 JSON，包括：人物事实、情景事件和指令。在 L2 层，模型通过工具调用（如 read、write、edit）将记忆组织成主题性的 Markdown 叙述。在 L3 层，模型读取所有场景，生成一致的用户画像及交互协议。

每一层都支持基于游标的检查点机制。因此即使本地模型宕机，也不会丢失任何数据。管线会从最后处理过的游标位置继续执行。

为什么选择 Qwen 3.5-4B？

这是我找到的能可靠胜任该架构所需两项任务的最小模型：结构化 JSON 提取与多步工具调用。Qwen 2.5-3B 在这个场景下太脆弱了。而 Qwen 3.5-4B 恰好处于本地推理的最佳平衡点。

相似文章

@bayendor: 刚刚完成将三层记忆栈接入Hermes Agent。第一层：Honcho Session + PostgreSQL上的对等记忆。处…

X AI KOLs Timeline

描述了为Hermes Agent实现一个三层记忆栈，结合了PostgreSQL上的会话记忆、带有模式脱敏的工作记忆以及使用PGLite的长期知识图谱。

@verysmallwoods: 腾讯开源的 TencentDB-Agent-Memory，实现4层记忆系统。 https://open.substack.com/pub/verysmallwoods/p/tencentdb-agent-memory-openclaw-h…

X AI KOLs Timeline

腾讯开源了TencentDB-Agent-Memory，实现了四层记忆系统，支持通过OpenClaw插件集成并提供Hermes的Docker化方案，将PersonaMem准确率从48%提升至76%。

@Michaelzsguo：今天我将我的Hermes代理升级为TencentDB Agent Memory。我没有将其连接到云端LLM，而是将其连接到了…

相似文章

@bayendor: 刚刚完成将三层记忆栈接入Hermes Agent。第一层：Honcho Session + PostgreSQL上的对等记忆。处…

@verysmallwoods: 腾讯开源的 TencentDB-Agent-Memory，实现4层记忆系统。 https://open.substack.com/pub/verysmallwoods/p/tencentdb-agent-memory-openclaw-h…

@smykx：上个月我写了一篇博文，探讨了 @NousResearch 开发的 Hermes-Agent 的内存底层机制，链接在回复中。

@KSimback: https://x.com/KSimback/status/2058262328496554021

@mr_r0b0t: 如果你的设备拥有24-128GB统一内存，并且使用@NousResearch Hermes agents，那么这正适合你！你现在可以运行完全本地的智能体团队…

提交意见反馈