@shannholmberg: https://x.com/shannholmberg/status/2055335043904492011

X AI KOLs Timeline 2026/05/15 17:10 工具

摘要

Hermes Agent 是 NousResearch 开发的一款开源自主智能体框架，能够端到端地运行工作流，包括浏览器导航、终端命令和任务调度。本文提供了关于如何设置并使用它进行营销自动化的全面指南。

https://t.co/lrJAYG5iEE

查看原文

查看缓存全文

缓存时间: 2026/05/16 17:21

如何成为 Hermes Agent 操作员

学习如何操作并掌握 Hermes Agent。设置 Agent 控制室模板，配置专业 Agent，从单一 Agent 成长为一台 VPS 上的完整营销公司。

大多数 AI 工具只是回答问题。Hermes Agent 端到端地执行你的工作流。它能操作你的浏览器、执行终端命令、调度 cron 任务、监控你的收件箱、起草工作，并将结果发布到你所在的任何地方：Telegram、Discord、Slack、你当前正在参与的邮件线程。由 @NousResearch 构建，开源，拥有 150,000 个 GitHub Star。目前在 OpenRouter 上全球 Token 使用量排名第一。

这就是我过去几周构建整个营销运营所依赖的框架，而你现在正在阅读的文章，如果我今天从零开始，我会如何设置它。

你将在这篇文章中学到什么

Hermes Agent 是什么，以及为什么营销人员（不仅仅是开发者）应该关注它
对读者友好的架构解读：大脑、个性、技能集，以及它们如何共存于一个文件夹中
我目前正在 Hermes 上运行的实际用例，附四篇相关文章
四部分心智模型（你、控制室、Agent、可选的任务总线）以及四个设置层级，从“笔记本电脑上的一个 Agent”到“完全自动化的多 Agent 团队，你可以在 VPS 上通过手机控制”
我用来将营销工作流从混乱想法变为自主部署的原型 → 生产方法论
我希望能从第一天就拥有的资源：文档、社区地图、值得关注的人、正在进行的线下活动
诚实的权衡以及它仍然会失效的地方

我在这篇文章中不推销任何东西。Hermes 是开源的，Nous Portal 提供免费层，社区生态系统大部分也是免费的。Fork 它、修改它、让它成为你自己的。

Hermes Agent 是什么

简短版： 一个自主 Agent，运行时间越长，能力越强。

详细版： Hermes 是由 Nous Research 构建的框架，它将模型转变为持久操作员。它拥有自己的记忆，可以在对话轮次之间存活。它在工作时会自己编写技能。它内置了 123 项技能（GitHub 工作流、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、以及 100+ 更多）。它可以在你放置的任何地方运行：笔记本电脑、Docker 容器、VPS、Serverless 运行时。你可以通过 20+ 种方式与它对话：Telegram、Discord、Slack、邮件、语音模式，或者直接使用终端。

Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于：

它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
显示更多

引用
Shann3@shannholmberg·5月10日
1:51
Nate Herk 刚刚写出了互联网上最详尽的 Hermes Agent 设置指南
这里有 12 条教训，你在构建自己的 Agent 之前需要了解
x.com/19216745449994…4697714242K

如果你用过 Claude Code 或 OpenClaw，Hermes 在形态上类似，但理念不同。

Hermes 像 Rails。有意见的默认配置，电池包含在内，第一天就能高效工作，只需最少的设置，Agent 会为你做更多的思考。
OpenClaw 像 Linux。原语、保证、显式控制，Agent 完全按照你告诉它的去做，不做更多。

两者都有效。我运行 Hermes 是因为它捆绑的默认配置会产生复利。我启动的每个 Hermes 项目中，Agent 在我写一行配置之前就已经知道如何做 100+ 件事。这个先发优势对我来说值得。

我还注意到 Hermes 几乎不会有 Gateway 断开或出错的问题。

证据就在 Nous Research 刚刚达成的数字中：

OpenRouter 全球 Token 使用量排名第一（平台上的所有模型和框架中）
Hermes 仓库 150,000 个 GitHub Star
123 项内置技能，Agent 自己编写技能之前
Gateway 中 70+ 内置工具，外加通过一个订阅接入 300+ 模型
6 个部署目标：本地、Docker、SSH、Daytona、Singularity、Modal
20+ 消息界面：Telegram、Discord、Slack、邮件、语音

如果你是一个 AI 营销人员，还没有开始运行 Hermes，你每周都在把复合能力留在桌上。

它是如何工作的（对读者友好的版本）

每个 Hermes Agent 有三个部分。

一个大脑。 记忆存储在 ~/.hermes/memories/ 中。两个文件，MEMORY.md 和 USER.md，在会话启动时注入。你的语调准则、品牌笔记、客户语言、上周的修正，所有这些都在第一个提示之前加载。会话存储在 SQLite 中，跨会话的回忆可以通过全文搜索实现。

一个个性。 soul.md 是氛围存放的地方。简洁、讽刺、直率、正式、快速或深思熟虑。你可以启动六个 Agent，给每个不同的灵魂，共享同一个大脑。一个是你的对外代表，有成交者的能量；另一个是你的研究员，喜欢长句子；还有你的助理，保持一切简短。

一组技能集。 开箱即用的 123 项技能：GitHub PR、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、浏览器控制、网页抓取、视觉、语音、调度。以及闭环学习：Agent 在工作时会沿途编写新技能。你自己的技能库会在那 123 项之上增长，而你无需编写任何技能。

然后是 Agent 可以与之对话的东西。

工具 Gateway：一个订阅，300+ 模型，外加内置的网页抓取和浏览器自动化
MCP 集成：任何支持模型上下文协议的外部服务都会变成 Agent 可以使用的工具
20+ 消息界面：Telegram、Discord、Slack、邮件、语音，加上 CLI 本身

以及 Agent 可以运行的地方。

你的笔记本电脑（本地）
一个 Docker 容器（隔离、可移植，我用的方式）
VPS 上的 SSH 会话（即使合上笔记本电脑也能运行）
Daytona、Singularity、Modal（如果你不想管理基础设施，可以使用 Serverless）

闭环学习是它区别于智能聊天机器人的关键。Agent 观察自己的工作，在了解你工作形态时编写新技能，定期精炼记忆，并通过全文搜索和 LLM 摘要结合的方式跨会话回忆过去上下文。你不必下周再重新教它。

我告诉刚接触 Hermes 的人一条规则：第一天不要试图编写自己的技能。运行真正的工作，让 Agent 观察，让 harness 去编写技能。通过工作构建自定义技能库比通过编写提示更快。

我在 Hermes 上运行什么

我是一个 AI 营销人员，不是编码员。我在 Hermes 上运行的大部分是营销基础设施，偶尔有内部工具。以下是实际列表：

一个个人助手，处理商务和私人事务，运行在 Telegram 上，每天早上标记四封值得阅读的邮件，安排提醒，总结我错过的会议
一个营销工作流原型台，我在这里测试新的流程（营销磁石、广告创意审查、内容冲刺），在推广之前针对实际工作运行 2-3 次
专业的营销 Agent：SEO、对外/BD、设计审查、内容写作，每个都有自己独特的灵魂和作用范围
一个公司大脑，监控 Slack、聊天、邮件、转录、语音备忘录，让所有内容都可查询。当我问“上个月我们对那个客户关于定价说了什么？”时，3 秒内得到答案，而不是 30 分钟的挖掘
一个 SEO Agent，在一个 Docker 容器中运行从关键词种子到发布文章的完整管道，21 个步骤，无需人工介入直到最终审查
一个内容分发 Agent，将一篇长文（比如本文）分解并发布到 LinkedIn、X、Threads，带有平台特定的钩子
一个编排 Agent，本身不产生工作，只根据我的请求将任务路由到正确的专业 Agent

我发布的总结蓝图：

Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层，所有容器都在一台 VPS 上的隔离 Docker 容器中：

公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
编排 Hermes Agent – 读取公司大脑，选择正确的部门……
显示更多

引用
Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于：

它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
x.com/14559993134531…541081K133K

特别是 SEO Agent 值得深入探讨，因为它是我公开发布过的，也是最符合本文架构的。五层，全部在一个 Docker 容器内，21 个步骤，从关键词种子到发布文章。这 21 个步骤在终端中看起来像这样：

该管道之上的层级：

公司大脑 在顶部：愿景、品牌、受众、产品。每个 Agent 都从中读取
编排 Hermes Agent：获取主题或关键词种子，将其路由到 SEO Agent
SEO 脑：排名剧本、语调规则、内容格式、视觉风格指南、每种格式的成功标准。所有 SEO 特定的上下文都存于此
SEO Agent 内的三个子 Agent，每个处理一个阶段：
- 研究 + 构思：关键词种子、SERP 快照、竞争对手提取、意图和格式分析、内容和视觉差距、内部和外部验证
- 生产：角度和定位简报、视觉策略简报、大纲、草稿、图像生成、流程图生成、视觉和文章质量检查
- 分发：发布准备、Schema、内部链接、联合、分析、监控
一个 Docker 容器 包含所有三个子 Agent。它们共享环境、记忆和工具。子配置文件根据阶段切换上下文。一个进程、一个文件系统、一套凭证。

为什么用一个容器而不是三个：SEO 工作是顺序的。研究为简报提供信息，简报为生产提供信息，生产为分发提供信息。每一步都需要记住上游决策。拆分为三个容器意味着需要跨边界传递状态，这既昂贵又容易中断链路。

公司中其他每个专业 Agent 都运行在相同的模板上。克隆 SEO Agent 模板，交换大脑（SEO 脑 → 对外脑，或设计脑，或支持脑），你就得到了一个在任何功能上都相同五层形状的新 Agent。

Shann3@shannholmberg·5月15日
在组织架构图中我的 Hermes SEO Agent 如何工作
它运行从关键词种子到发布文章的完整管道，21 个步骤，全部在一个 Docker 容器内
结构：
第1层：公司大脑
共享上下文：愿景、品牌、受众、产品。每个 Agent 都从中读取
显示更多

引用
Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层，所有容器都在一台 VPS 上的隔离 Docker 容器中：

公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
编排 Hermes Agent – 读取公司大脑，选择正确的部门……
x.com/14559993134531…101419414K

这些层级不是装饰。它们是 Agent 在工作变得专业化时不丢失上下文的原因。公司大脑保持稳定，而工人迭代。大脑层级让工人可替代。

我最近还在里斯本的 @EspressioAI 总部为 Nous Research 举办了一场 Hermes Agent 之夜。@yeahfortommy 来自 Nous，主持了问答环节，noticed.so 的 Simao 展示了一个带有自动研究的 Agent harness，而我则讲解了我们在 Espressio 如何使用 Hermes 实现增长。

Shann3@shannholmberg·4月27日
我们正在 @Espressio 总部为 @NousResearch 举办 Hermes Agent 之夜
@touchgrassklub 正在与 Talent Protocol 合作组织
以下是当晚的议程：

我将首先介绍如何使用 Hermes Agent 实现增长，我们在……
显示更多
1144723K

如果你在里斯本，想参加下一次活动，我会在安排时间后发布通知。

从一个 Agent 到完整舰队

在层级之前，先讲心智模型。设置包含四个部分：

你是操作员。你可以直接访问系统的每个部分。
Agent 控制室 是侧边控制面板。它不是你可以通过它聊天的 Agent。它是一个文件夹，位于 /root/vps-agents，记录并管理整个舰队。你可以打开它、编辑它、检查它，或者在管理系统时让 Claude、Codex 或 Hermes 使用它。
Hermes Agents 是工人。有些是专业化的（SEO、开发、CMO、运营）。其中一个可以可选地成为编排器。
Agent 任务总线 是一个可选的交接台，位于编排器和专业 Agent 之间。只有当你有编排器在运行时才需要它。

整体看起来像这样：

存储拆分比人们想象的更重要：
控制室包含以下问题的答案：存在哪些 Agent、它们做什么、使用哪些端口、引用哪些凭证、每个 Agent 能做什么不能做什么、以及如何重启、调试或重建任何一个。
实时运行时包含实际的工作内容。

控制室是定义系统的大脑。实时运行时是运行系统的身体。你可以从大脑重建身体。你不能从身体重建大脑。

在控制室内：

在每个 Agent 的运行时中，位于 /srv//data/：

三种交互方式

控制路径 是元层。用于添加 Agent、审查文档、检查端口、轮换密钥、调试设置。
直接路径 是最快的。用于你已经知道哪个 Agent 做这项工作。
编排路径 是合成器。用于你想要一个前门，将多个专业的工作路由并组合起来。

层级1：单一 Agent

你只有一个 Hermes Agent。仅此而已。控制室仍然可以存在（推荐），但只记录那个 Agent。
最适合：初始设置、你的个人 Hermes、根安装文档、简单的 Docker 迁移。
一个 Agent，已经运行一段时间，拥有你调整过的个性和已经开始构建的记忆。用你想要的语调填充 SOUL.md，用关于你业务的稳定事实填充 MEMORY.md，用关于你的稳定事实填充 USER.md。将其连接到 Telegram 或 Discord，这样它就在你所在的地方。开始在实际任务上使用它。让它接触你的工具。让它沿途编写自己的技能。
MEMORY.md 保存稳定事实（你的业务是什么、你的客户是谁、你的产品做什么）。USER.md 保存关于你的稳定事实（时区、工作时间、重复项目、首选输出格式）。两者每周都会在你与 Agent 进行真实对话并纠正它时得到精炼。

层级2：直接专业 Agent

你有多个专业 Agent，但你仍然直接与每个对话。还没有编排器。控制室记录所有这些。
最适合：明确的角色分离、测试哪些 Agent 有用、避免过早编排、将凭证范围限定在每个 Agent 内。

需要避免的陷阱是：在你证明专业 Agent 有用之前就急于使用编排器。先启动两三个，直接运行它们，只有当你发现自己想要一个前门时才添加编排器。

何时启动新 Agent 与坚持现有 Agent：
不好的模式：一个巨型 Agent，将每个凭证和每个记忆层混在一起。你会失去隔离，无法干净地撤销访问权限，Agent 也会对使用哪个语调感到困惑。

层级3：编排器 + 专业 Agent

你添加 hermes-orchestrator 作为前门。你仍然可以直接与专业 Agent 对话，但编排器可以路由工作并合成结果。编排器读取控制室。

@shannholmberg: https://x.com/shannholmberg/status/2055335043904492011

如何成为 Hermes Agent 操作员

你将在这篇文章中学到什么

Hermes Agent 是什么

它是如何工作的（对读者友好的版本）

我在 Hermes 上运行什么

从一个 Agent 到完整舰队

三种交互方式

层级1：单一 Agent

层级2：直接专业 Agent

层级3：编排器 + 专业 Agent

相似文章

NousResearch/hermes-agent

@KanikaBK: https://x.com/KanikaBK/status/2053845110048293272

@itsolelehmann: https://x.com/itsolelehmann/status/2056343273023688989

@nateherk: https://x.com/nateherk/status/2053308681299616125

@ScottyBeamIO: https://x.com/ScottyBeamIO/status/2066885278451519590

提交意见反馈