@nateherk: https://x.com/nateherk/status/2053308681299616125

X AI KOLs Timeline 工具

摘要

本文详细介绍了 Hermes——由 Nous Research 构建的一个开源 AI Agent 框架,它专注于内存、技能以及用于即时自动化的自我改进循环。

https://t.co/pQx1ROn7vm
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/10 14:27

从零构建终极 Hermes Agent 大军

Hermes Agent。开源,MIT 许可,GitHub 上已有 14 万颗星星且增长迅速。由 Nous Research 打造。

这是全面拆解。包括心智模型、设置、API 密钥处理、第一个值得运行的定时任务(cron)、仪表盘、扩展规则,以及如果我们要一起构建一个时会给出的每一条实用建议。

TL;DR(太长不看版)

→ Hermes 是一个与你共同成长的开源 Agent。支持 VPS、Mac Mini、笔记本、Docker,甚至通过 Termux 支持 Android。

→ 五大支柱:记忆(Memory)、技能(Skills)、灵魂(Soul)、定时任务(Crons)、自我改进循环(Self-Improving Loop)。

→ 可连接 Telegram、Discord、Slack、WhatsApp、iMessage。

→ 我并没有用它取代 Claude Code。Hermes 是口袋中的、以语音为先、支持计划自动化的层。

Hermes 到底是什么

它是你口袋里的 Agent。

Claude Code 是我在办公桌前进行知识工作和编码时的日常主力。

Hermes 是当我遛狗、在飞机上或离开笔记本时,通过 Telegram 与之对话的对象。

同样的大脑,不同的界面。

开箱即附带 91 项技能。社区中心还有 520 多项。其中 16 项是 Anthropic 的官方技能。我从未需要手动安装 Excalidraw 或转录技能——它们都已经存在。

我的主要 Agent 执行以下任务:

→ 每日 AI 新闻简报,发布到我的 Skool 社区 → YouTube 评论监控,回复带有讽刺意味但不粗鲁 → Skool 社区互动 → 晨间业务摘要 → 服务器健康检查 → 研究报告 → 跟进提醒

全部按计划执行。全部通过自然语言指令。

我曾让它使用 HyperFrames 制作一个关于它自己的视频。它进行了研究,自行安装了 HyperFrames,使用视觉功能对自己的输出进行评分,迭代后生成了一段还算不错的视频。

思维转变:Hermes 比你更了解 Hermes。只需问它。

Hermes vs Claude Code vs OpenClaw

这些不是同一类工具。不要只选一个。

Claude Code 是 Anthropic 的编码助手。居住在你代码旁边的终端中。你需要坐下来驾驶它。它是桌面工作的日常主力。

OpenClaw 由 Peter Steinberger(现任职于 OpenAI)创建。拥有 35 万+ 星星。NVIDIA 在其基础上构建了 Nemo Claw。是一款强大的随行 Agent。

Hermes 更轻量、更快,更侧重于自我改进循环。专为那些想要折腾 Qwen 和 LLaMA 等开源模型的人打造。

我从 OpenClaw 切换到 Hermes,因为 OpenClaw 在快速更新后崩溃太频繁。对我来说,Hermes 更稳定。

解锁之道:所有这些都可以并行运行在同一个 GitHub 仓库中。你的业务上下文、技能和记忆都生活在版本控制中。然后任何 Agent(Claude Code、Hermes、OpenClaw、Codex)都可以接入其中。

术语有所不同(Claude.md vs Agents.md vs Hermes 文件),但每个 Agent 都理解自己的约定。告诉它“让这个仓库为你工作”,它便会适应。

五大支柱

这是让 Hermes 运转起来的心智模型。跳过这部分,其他内容都无法理解。

1️⃣ 记忆 (Memory)

user.md 定义了你是谁、你的风格、你的偏好、你不喜欢的事物 → memory.md 包含你的项目、环境、业务上下文 → 两者在会话开始时加载,因此 Agent 不会每次醒来都失去状态 → 想想《记忆碎片》(Memento)。除非你为它们构建了上下文,否则 Agent 醒来时没有任何记忆 → Hermes 会自动提取事实并在工作时更新这些文件 → 不要被动。告诉它:“把这个存入记忆”或“更新 user.md,这样我就不必再重复了” → 保存持久性的偏好和事实。使用会话搜索查找旧对话(存储在 SQLite 中) → 切勿将密钥或临时任务状态放入记忆中

2️⃣ 技能 (Skills)

→ 程序性记忆。可重用的剧本 → 食谱类比:从记忆中请求巧克力曲奇煎饼,结果往往不一致。拿出食谱,每次出来的效果都一样。 → 存储为带有 YAML 前元数据的 skill.md 文件 → 前元数据告诉 Agent 何时调用该技能(渐进式披露) → 正文仅在技能被调用时加载,因此不会膨胀上下文 → Hermes 分析你的对话,并提议将重复的模式转化为技能 → 给予反馈,技能会随时间更新

3️⃣ 灵魂 (Soul)

soul.md 塑造 Agent 的性格 → 启动六个 Hermes Agent,每一个都可以有自己的风格 → 简洁、讽刺、直率、正式,无论适合什么角色 → 我的 YouTube 评论 Hermes 是讽刺的但不粗鲁。这都在灵魂文件中定义 → 随着你给予反馈,它会随时间进化

4️⃣ 定时任务 (Crons)

→ 这里是 Hermes 甩开 Claude Code 的地方 → 告诉它“每天早上 6 点做 X”,它就会去做 → 每个 cron 在新鲜的隔离会话中运行,并将结果发送回聊天 → 有用的标志:CONTEXTFROM 将一个任务的输出传递到下一个任务;WORKDIR 从项目文件夹运行工具;NOAGENT 在没有代理钩子循环的情况下运行脚本(仅执行工作流,无 Agent 推理) → Cron 会话不能递归创建更多的 cron 任务,因此提示必须是自包含的 → 你还可以设置有时限的 crons。“在接下来的 12 小时内,每 10 分钟运行一次,然后终止”的工作原理与 Claude Code 中的 /loop 斜杠命令相同

5️⃣ 自我改进循环 (Self-Improving Loop)

→ 做工作,获得反馈,保存到记忆 → 将可重复的步骤转化为技能 → 当旧上下文重要时,搜索过去的会话 → 你使用得越多,它就变得越好 → 诚实的警告:自动化不等于魔法。当你当场纠正它、要求它保存事物并在复杂工作后让它创建新技能时,这个循环效果最佳

还有一个值得提及的第六点:agents.md(Codex 的版本,类似于 Claude.md)。项目级上下文。当你在终端中使用 Hermes 进行编码时很有用。

另外,我的 Hermes Agent 生成了所有这些 Excalidraw 图表 ;)

拯救你的 Claude Code 技巧

这是大多数人会跳过的步骤。不要跳过。

构建一个 Claude Code 项目来管理你的 Hermes Agent。

我有一个名为 vps-agents 的项目。里面,每个 Agent 都有自己的文件夹。我的包括 bull(我的交易机器人)、我的主要 Hermes、uppit-os 和 claus(我的个人助理)。

每个文件夹存储:

→ IP 地址 → 管理员用户名和密码 → 关于哪些 API 密钥位于何处的注释 → 容器设置细节 → Docker 信息 → 安全和集成注释

为什么这很重要:当深夜 11 点出现问题时,我不必在 Hostinger 中翻找密码。我打开 Claude Code,指向该项目,它会为我修复 Agent。

你在为助手构建助手。

在 Hostinger 上设置你的 VPS

VPS 是你租用的云中的计算机。获取 IP,获取密码,SSH 进入,安装东西。搞定。

路径如下:

→ 选择一个计划。KVM2 足以开始。如果追求便宜则选 KVM1。如果需要更多 CPU/内存,稍后可扩展 → 年度计划能省真金白银。使用代码 NATEHURK 享受 9 折优惠 → 选择 Ubuntu 24.04 LTS 作为操作系统 → Hostinger 市场有一个 Hermes Agent 一键安装,如果你想跳过手动路线 → 设置根密码(如果忘记,以后可以重新生成) → 开启免费的恶意软件扫描器

现在是一个关键选择:在 VPS 根目录安装还是使用 Docker?

根安装: Hermes 直接生活在 VPS 的根层级 → Docker 容器(一键): 每个 Agent 获得一个隔离的容器,拥有自己的密钥、记忆和工具

我选择了 Docker。每个 Agent 保持清晰分离。以后可以轻松启动一个营销 Hermes、一个财务 Hermes 或一个内容 Hermes,每个都在自己的容器中,每个都有自己的 .env

专业提示:更改主机名,以便你的 VPS 列表保持有序。我的看起来像 youtube-hermes.vps。Hostinger 的 UI 会即时更新。

导入 Hermes

一旦容器部署完成,点击打开。输入管理员用户名和密码。导入流程启动。

这里是推理提供商的选择。Hermes 支持大量提供商。对大多数人来说最便宜的方案:

→ 通过 OAuth 的 OpenAI Codex。将现有的 ChatGPT 订阅(20、100 或 $200/月)接入 Hermes,而不是消耗 API 令牌。

对于开源纯粹者模式,你可以在本地运行 Qwen 或 LLaMA。我还没到那一步。计划稍后实验。

选择你的模型(我的情况是 GPT-5.5)。设置消息传递。从列表中用空格键选择 Telegram。

Telegram 设置,90 秒:

1️⃣ 打开 Telegram,给 BotFather 发消息,输入 /newbot 2️⃣ 命名你的机器人。用户名必须以 “Bot” 结尾 3️⃣ 复制令牌。粘贴回 Hermes 终端 4️⃣ 从 USERINFO 机器人获取你的 Telegram 用户 ID 5️⃣ 将用户 ID 粘贴到 Hermes 中,将机器人锁定给你

预启用的工具:视觉、浏览器自动化、图像生成、文本转语音、终端命令、任务规划、技能。

将 Hermes 在导入期间打印的所有内容(设置路径、API 密钥路径、配置路径)保存到你的 Claude Code 项目中。未来的你会感谢现在的你。

以下是引人注目的地方。在开始前我不需要知道任何这些。我只是在过程中询问 Hermes 和 Claude Code 来解释。

正确处理 API 密钥

不要在聊天中粘贴 API 密钥。即使模型是私有的,密钥现在也在对话历史中。

如果你使用托管模型并意外泄露了一个,只需轮换它。世界末日不会来临。但最佳实践是永远不要粘贴它们。

正确的方法:

1️⃣ SSH 进入你的容器 2️⃣ 运行 hermes config set GITHUB_TOKEN [your_token] 3️⃣ 密钥保存到容器的 /opt/data/.env 中。模型从未见过。日志中也没有。

每个密钥都采用相同的模式。按 Agent 命名。范围仅限于该 Agent 实际所需的最小权限。

如果你需要清除或轮换密钥,询问 Hermes 获取 Nano 命令以打开正确的 .env。我第一次尝试时,命令指向根 VPS 的 .env,而不是容器的。当我告诉它 Agent 在 Docker 内运行时,Hermes 自我纠正了。教训:你不需要理解路径树,只需要清楚地沟通你看到的内容。

第一个值得构建的定时任务

将 Hermes 连接到私有 GitHub 仓库。然后安排夜间同步。

如果 VPS 损坏,你的技能和记忆就丢失了。有了 GitHub 备份,你可以启动一个新的 Hermes,指向该仓库,你就重新上线了。

我告诉我的 Agent:“每晚午夜中部时间,将所有非密钥内容推送到我的私有 GitHub 仓库。”

它构建了技能。设置了 cron。编写了 .gitignore 以确保密钥永远不会被提交。搞定。

烦人的部分:容器默认以 UTC 时间运行。Hermes 自行检查中部时间的整点以处理夏令时。它自己弄明白了这一点。

令牌最佳实践:经典 GitHub 令牌,范围仅限于仓库 + 内容(读取和写入)。不要授予 Agent 不需要的更多权限。

这就是循环。自然语言输入。工作自动化输出。

CLI vs Telegram

相同的 Agent,相同的大脑,相同的技能,相同的记忆,相同的窗口。不同的界面。

CLI(终端) 是驾驶舱。最适合深度工作、编码、硬核构建。你可以看到上下文使用情况,管理压缩,使用斜杠命令,并像操作系统一样生活在那里。 → Telegram 是遥控器。最适合计划任务、快速任务、语音消息、随行知识工作、从手机与之对话。

Telegram 对上下文的可见性较低。会话感觉模糊,因为自动压缩在后台运行,你真的看不到何时发生。所以不要通过 Telegram 编写代码应用程序。上下文腐烂的风险太高。

但对于“嘿,检查 ClickUp”、“帮我研究这个”、“安排这个 cron”、“发布到 Skool”——Telegram 比 CLI 快得多。

基于令牌的上下文,而不是基于消息。模型总是看到系统提示 + user.md + soul.md + memory.md。所有这些都必须在范围内。当你接近限制时,自动压缩触发。

添加第一个技能的两种路径

有两种方法可以添加技能。

描述结果。 “每晚午夜中部时间,同步这个仓库。”Hermes 构建技能,命名它,设置 cron,完成。 → 从 URL 安装。 从社区中心或你自己的 Claude Code 项目中获取技能。告诉 Hermes 链接。它安装并注册它。

我通过要求 Hermes 安装官方 HyperFrames 技能并根据其自己的 soul.md 生成一段 5 秒的自我介绍视频来测试。它完成了安装,运行了技能,并生成了一个可用的片段,无需额外的指导。

观察 Agent 在工作时。如果你希望它调用一个技能但它没有,这就是你告诉它的信号:“更新 YAML 前元数据,以便当我提到类似 X 的事情时触发此技能。”

这就是技能变得锋利的方式。

像对待新员工一样对待 Hermes

这是不可商榷的。

→ 每个 Hermes Agent 都有自己的账户(Gmail 或代理邮件),而不是你的 → 每个 Agent 都有自己的 API 密钥,范围严格受限 → 按 Agent 使用命名的 API 密钥(OpenRouter、Perplexity 等),以便查看哪个 Agent 花费了多少 → 最小权限规则:仅需要工作所需的凭证和工具 → 营销 Agent 不需要 QuickBooks 的读取权限。财务 Agent 需要

你不会把信用卡交给全新的实习生。也不要把它交给你的 Agent。

也要锁定 VPS。在 Hostinger 上设置防火墙,限制为你的 IP,阻止未使用的端口。构建一个技能,每晚运行安全审计。Hermes 可以攻击自己的设置并报告发现的内容。

在此之前我对防火墙一无所知。Hermes 和 Claude Code 带我走过了整个过程。Agent 教你系统。

维护规则

这是我保持 Agent 锋利的规则:

→ 在同一件事上错两次?当场纠正它,并告诉它更新相关的技能或记忆 → 同一指令两次?要求 Hermes 为此编写一个技能 → 冗长或语气不当?编辑灵魂 → 新的计划任务?构建一个技能,然后要求 Hermes 安排它 → 出问题了?首先检查 memory.md。过时的记忆是奇怪 Agent 行为的头号原因

随时审计。“朗读你的记忆文件。朗读你的灵魂文件。”看看里面有什么。砍掉错误的部分。

这不是你设置完就完事的工具。这是一个你需要不断培训的队友。

压缩会到来。不要恐慌

最终你会遇到自动压缩阈值。我的在大约 17 万令牌时触发(阈值约为 13.6 万)。

当它失败时,Hermes 插入一个回退上下文标记,暂停需要暂停的 crons,并在继续之前更新记忆。

如果你不理解刚才发生了什么,将消息粘贴回给它:“向我解释一下。那个回退标记是什么意思?”它会解释。这是循环的一部分。

何时启动第二个 Hermes

简单的决策树:

→ 需要自己的凭证、密钥或工具? → 新 Agent → 需要自己的长期记忆? → 新 Agent → 持续的、重复的工作,基本上是一个单独的角色? → 新 Agent → 否则 → 保留在你的主要个人 Agent 中

建议:首先充分利用你的主要个人 Hermes。一旦在那里构建了五到十个技能,分割就变得显而易见。

迁移很容易。技能、crons、灵魂、记忆都是 markdown 文件。移动它们,让新 Agent 指向它们,你就运行了。

坏模式:一个拥有所有 API 密钥、所有技能、所有 cron 的超级 Agent。高混淆。出问题时高爆炸半径。

好模式:一个主要个人 Hermes 加上为营销、财务、内容或任何适合的行业拆分的 Agent。每个都在自己的 Docker 容器中。每个都有范围受限的密钥。每个都有自己的 .env,永远不会提交到 GitHub。

你的主要 Hermes 可以帮助你规划组织结构。把它当作你的 COO。问它:“基于我们构建的内容,我应该首先拆分什么?”它会有意见。

仪表盘和看板

Hermes 附带自己的仪表盘。最近的会话、连接的平台、密钥、配置、技能、插件、crons 以及用于在多个 Agent 之间分配任务的看板。

第一次打开时,你必须隧道进入容器,打开网关,并运行几个命令。第一次尝试时有点笨拙。

修复方法:

相似文章

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2052836621905510541

X AI KOLs Timeline

# Hermes Agent v0.13.0("韧性版本")发布:持久看板、目标持久化与检查点回滚 Hermes Agent v0.13.0 正式发布,代号"The Tenacity Release"(韧性版本),本次更新带来了持久化看板(Durable Kanban)、持久目标(Persistent Goals)、Checkpoints v2(含回滚功能)以及 8 项 P0 级安全修复,将自身定位为与 Claude Code、Codex 等编码智能体并肩的**运行时持久层**。此次发布恰逢 DeepSeek V4-Pro、MiMo-V2.5-Pro 等支持百万级上下文窗口的低成本模型相继推出,使长期运行的智能体软件变得更具可行性。 ## 核心新特性 ### 持久看板(Durable Kanban) 任务状态不再随会话结束而丢失。看板数据现可跨会话持久保存,智能体可在中断后无缝恢复工作流,无需从头重建任务上下文。 ### 持久目标(Persistent Goals) 智能体的长期目标现在可以跨越多个会话持续存在。这意味着用户无需在每次启动时重新向智能体说明意图,系统能够自主维护目标状态并持续推进执行。 ### Checkpoints v2(含回滚) 升级后的检查点系统引入了**回滚能力**,允许将智能体状态恢复至任意历史检查点。这对于长时间运行的任务尤为关键——一旦某个执行分支出现错误,可直接回退而无需从零重启。 ### 8 项 P0 级安全修复 本次版本针对最高优先级安全漏洞进行了全面修复,共解决 8 个 P0 级问题,进一步强化了生产环境下的部署安全性。 ## 定位:运行时持久层 Hermes Agent 将自身明确定位为**运行时持久层**,与 Claude Code、Codex 等以代码生成为核心的编码智能体形成互补,而非竞争。其核心价值在于为智能体提供可靠的状态管理与执行连续性,解决长期任务中"断点续跑"这一关键工程问题。 ## 时机:百万上下文模型降低门槛 此次发布的时机颇具战略意义。随着 DeepSeek V4-Pro 和 MiMo-V2.5-Pro 等支持百万 token 上下文窗口的模型以极低成本落地,长时间运行的智能体任务从理论走向实践的障碍正在迅速消除。上下文容量的扩展与持久化基础设施的成熟,共同构成了**长期智能体软件**规模化应用的两大前提条件,而 Hermes Agent v0.13.0 正是在这一窗口期及时补上了基础设施侧的关键拼图。