@shannholmberg: https://x.com/shannholmberg/status/2055335043904492011

X AI KOLs Timeline 工具

摘要

Hermes Agent 是 NousResearch 开发的一款开源自主智能体框架,能够端到端地运行工作流,包括浏览器导航、终端命令和任务调度。本文提供了关于如何设置并使用它进行营销自动化的全面指南。

https://t.co/lrJAYG5iEE
查看原文
查看缓存全文

缓存时间: 2026/05/16 17:21

如何成为 Hermes Agent 操作员

学习如何操作并掌握 Hermes Agent。设置 Agent 控制室模板,配置专业 Agent,从单一 Agent 成长为一台 VPS 上的完整营销公司。

大多数 AI 工具只是回答问题。Hermes Agent 端到端地执行你的工作流。它能操作你的浏览器、执行终端命令、调度 cron 任务、监控你的收件箱、起草工作,并将结果发布到你所在的任何地方:Telegram、Discord、Slack、你当前正在参与的邮件线程。由 @NousResearch 构建,开源,拥有 150,000 个 GitHub Star。目前在 OpenRouter 上全球 Token 使用量排名第一。

这就是我过去几周构建整个营销运营所依赖的框架,而你现在正在阅读的文章,如果我今天从零开始,我会如何设置它。

你将在这篇文章中学到什么

  • Hermes Agent 是什么,以及为什么营销人员(不仅仅是开发者)应该关注它
  • 对读者友好的架构解读:大脑、个性、技能集,以及它们如何共存于一个文件夹中
  • 我目前正在 Hermes 上运行的实际用例,附四篇相关文章
  • 四部分心智模型(你、控制室、Agent、可选的任务总线)以及四个设置层级,从“笔记本电脑上的一个 Agent”到“完全自动化的多 Agent 团队,你可以在 VPS 上通过手机控制”
  • 我用来将营销工作流从混乱想法变为自主部署的原型 → 生产方法论
  • 我希望能从第一天就拥有的资源:文档、社区地图、值得关注的人、正在进行的线下活动
  • 诚实的权衡以及它仍然会失效的地方

我在这篇文章中不推销任何东西。Hermes 是开源的,Nous Portal 提供免费层,社区生态系统大部分也是免费的。Fork 它、修改它、让它成为你自己的。

Hermes Agent 是什么

简短版: 一个自主 Agent,运行时间越长,能力越强。

详细版: Hermes 是由 Nous Research 构建的框架,它将模型转变为持久操作员。它拥有自己的记忆,可以在对话轮次之间存活。它在工作时会自己编写技能。它内置了 123 项技能(GitHub 工作流、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、以及 100+ 更多)。它可以在你放置的任何地方运行:笔记本电脑、Docker 容器、VPS、Serverless 运行时。你可以通过 20+ 种方式与它对话:Telegram、Discord、Slack、邮件、语音模式,或者直接使用终端。

Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于:

它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
显示更多

引用
Shann3@shannholmberg·5月10日
1:51
Nate Herk 刚刚写出了互联网上最详尽的 Hermes Agent 设置指南
这里有 12 条教训,你在构建自己的 Agent 之前需要了解
x.com/19216745449994…4697714242K

如果你用过 Claude Code 或 OpenClaw,Hermes 在形态上类似,但理念不同。

Hermes 像 Rails。有意见的默认配置,电池包含在内,第一天就能高效工作,只需最少的设置,Agent 会为你做更多的思考。
OpenClaw 像 Linux。原语、保证、显式控制,Agent 完全按照你告诉它的去做,不做更多。

两者都有效。我运行 Hermes 是因为它捆绑的默认配置会产生复利。我启动的每个 Hermes 项目中,Agent 在我写一行配置之前就已经知道如何做 100+ 件事。这个先发优势对我来说值得。

我还注意到 Hermes 几乎不会有 Gateway 断开或出错的问题。

证据就在 Nous Research 刚刚达成的数字中:

  • OpenRouter 全球 Token 使用量排名第一(平台上的所有模型和框架中)
  • Hermes 仓库 150,000 个 GitHub Star
  • 123 项内置技能,Agent 自己编写技能之前
  • Gateway 中 70+ 内置工具,外加通过一个订阅接入 300+ 模型
  • 6 个部署目标:本地、Docker、SSH、Daytona、Singularity、Modal
  • 20+ 消息界面:Telegram、Discord、Slack、邮件、语音

如果你是一个 AI 营销人员,还没有开始运行 Hermes,你每周都在把复合能力留在桌上。

它是如何工作的(对读者友好的版本)

每个 Hermes Agent 有三个部分。

一个大脑。 记忆存储在 ~/.hermes/memories/ 中。两个文件,MEMORY.md 和 USER.md,在会话启动时注入。你的语调准则、品牌笔记、客户语言、上周的修正,所有这些都在第一个提示之前加载。会话存储在 SQLite 中,跨会话的回忆可以通过全文搜索实现。

一个个性。 soul.md 是氛围存放的地方。简洁、讽刺、直率、正式、快速或深思熟虑。你可以启动六个 Agent,给每个不同的灵魂,共享同一个大脑。一个是你的对外代表,有成交者的能量;另一个是你的研究员,喜欢长句子;还有你的助理,保持一切简短。

一组技能集。 开箱即用的 123 项技能:GitHub PR、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、浏览器控制、网页抓取、视觉、语音、调度。以及闭环学习:Agent 在工作时会沿途编写新技能。你自己的技能库会在那 123 项之上增长,而你无需编写任何技能。

然后是 Agent 可以与之对话的东西。

  • 工具 Gateway:一个订阅,300+ 模型,外加内置的网页抓取和浏览器自动化
  • MCP 集成:任何支持模型上下文协议的外部服务都会变成 Agent 可以使用的工具
  • 20+ 消息界面:Telegram、Discord、Slack、邮件、语音,加上 CLI 本身

以及 Agent 可以运行的地方。

  • 你的笔记本电脑(本地)
  • 一个 Docker 容器(隔离、可移植,我用的方式)
  • VPS 上的 SSH 会话(即使合上笔记本电脑也能运行)
  • Daytona、Singularity、Modal(如果你不想管理基础设施,可以使用 Serverless)

闭环学习是它区别于智能聊天机器人的关键。Agent 观察自己的工作,在了解你工作形态时编写新技能,定期精炼记忆,并通过全文搜索和 LLM 摘要结合的方式跨会话回忆过去上下文。你不必下周再重新教它。

我告诉刚接触 Hermes 的人一条规则:第一天不要试图编写自己的技能。运行真正的工作,让 Agent 观察,让 harness 去编写技能。通过工作构建自定义技能库比通过编写提示更快。

我在 Hermes 上运行什么

我是一个 AI 营销人员,不是编码员。我在 Hermes 上运行的大部分是营销基础设施,偶尔有内部工具。以下是实际列表:

  • 一个个人助手,处理商务和私人事务,运行在 Telegram 上,每天早上标记四封值得阅读的邮件,安排提醒,总结我错过的会议
  • 一个营销工作流原型台,我在这里测试新的流程(营销磁石、广告创意审查、内容冲刺),在推广之前针对实际工作运行 2-3 次
  • 专业的营销 Agent:SEO、对外/BD、设计审查、内容写作,每个都有自己独特的灵魂和作用范围
  • 一个公司大脑,监控 Slack、聊天、邮件、转录、语音备忘录,让所有内容都可查询。当我问“上个月我们对那个客户关于定价说了什么?”时,3 秒内得到答案,而不是 30 分钟的挖掘
  • 一个 SEO Agent,在一个 Docker 容器中运行从关键词种子到发布文章的完整管道,21 个步骤,无需人工介入直到最终审查
  • 一个内容分发 Agent,将一篇长文(比如本文)分解并发布到 LinkedIn、X、Threads,带有平台特定的钩子
  • 一个编排 Agent,本身不产生工作,只根据我的请求将任务路由到正确的专业 Agent

我发布的总结蓝图:

Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层,所有容器都在一台 VPS 上的隔离 Docker 容器中:

  1. 公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
  2. 编排 Hermes Agent – 读取公司大脑,选择正确的部门……
    显示更多

引用
Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于:

它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
x.com/14559993134531…541081K133K

特别是 SEO Agent 值得深入探讨,因为它是我公开发布过的,也是最符合本文架构的。五层,全部在一个 Docker 容器内,21 个步骤,从关键词种子到发布文章。这 21 个步骤在终端中看起来像这样:

该管道之上的层级:

  • 公司大脑 在顶部:愿景、品牌、受众、产品。每个 Agent 都从中读取
  • 编排 Hermes Agent:获取主题或关键词种子,将其路由到 SEO Agent
  • SEO 脑:排名剧本、语调规则、内容格式、视觉风格指南、每种格式的成功标准。所有 SEO 特定的上下文都存于此
  • SEO Agent 内的三个子 Agent,每个处理一个阶段:
    • 研究 + 构思:关键词种子、SERP 快照、竞争对手提取、意图和格式分析、内容和视觉差距、内部和外部验证
    • 生产:角度和定位简报、视觉策略简报、大纲、草稿、图像生成、流程图生成、视觉和文章质量检查
    • 分发:发布准备、Schema、内部链接、联合、分析、监控
  • 一个 Docker 容器 包含所有三个子 Agent。它们共享环境、记忆和工具。子配置文件根据阶段切换上下文。一个进程、一个文件系统、一套凭证。

为什么用一个容器而不是三个:SEO 工作是顺序的。研究为简报提供信息,简报为生产提供信息,生产为分发提供信息。每一步都需要记住上游决策。拆分为三个容器意味着需要跨边界传递状态,这既昂贵又容易中断链路。

公司中其他每个专业 Agent 都运行在相同的模板上。克隆 SEO Agent 模板,交换大脑(SEO 脑 → 对外脑,或设计脑,或支持脑),你就得到了一个在任何功能上都相同五层形状的新 Agent。

Shann3@shannholmberg·5月15日
在组织架构图中我的 Hermes SEO Agent 如何工作
它运行从关键词种子到发布文章的完整管道,21 个步骤,全部在一个 Docker 容器内
结构:
第1层:公司大脑
共享上下文:愿景、品牌、受众、产品。每个 Agent 都从中读取
显示更多

引用
Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层,所有容器都在一台 VPS 上的隔离 Docker 容器中:

  1. 公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
  2. 编排 Hermes Agent – 读取公司大脑,选择正确的部门……
    x.com/14559993134531…101419414K

这些层级不是装饰。它们是 Agent 在工作变得专业化时不丢失上下文的原因。公司大脑保持稳定,而工人迭代。大脑层级让工人可替代。

我最近还在里斯本的 @EspressioAI 总部为 Nous Research 举办了一场 Hermes Agent 之夜。@yeahfortommy 来自 Nous,主持了问答环节,noticed.so 的 Simao 展示了一个带有自动研究的 Agent harness,而我则讲解了我们在 Espressio 如何使用 Hermes 实现增长。

Shann3@shannholmberg·4月27日
我们正在 @Espressio 总部为 @NousResearch 举办 Hermes Agent 之夜
@touchgrassklub 正在与 Talent Protocol 合作组织
以下是当晚的议程:

我将首先介绍如何使用 Hermes Agent 实现增长,我们在……
显示更多
1144723K

如果你在里斯本,想参加下一次活动,我会在安排时间后发布通知。

从一个 Agent 到完整舰队

在层级之前,先讲心智模型。设置包含四个部分:

  • 是操作员。你可以直接访问系统的每个部分。
  • Agent 控制室 是侧边控制面板。它不是你可以通过它聊天的 Agent。它是一个文件夹,位于 /root/vps-agents,记录并管理整个舰队。你可以打开它、编辑它、检查它,或者在管理系统时让 Claude、Codex 或 Hermes 使用它。
  • Hermes Agents 是工人。有些是专业化的(SEO、开发、CMO、运营)。其中一个可以可选地成为编排器。
  • Agent 任务总线 是一个可选的交接台,位于编排器和专业 Agent 之间。只有当你有编排器在运行时才需要它。

整体看起来像这样:

存储拆分比人们想象的更重要:
控制室包含以下问题的答案:存在哪些 Agent、它们做什么、使用哪些端口、引用哪些凭证、每个 Agent 能做什么不能做什么、以及如何重启、调试或重建任何一个。
实时运行时包含实际的工作内容。

控制室是定义系统的大脑。实时运行时是运行系统的身体。你可以从大脑重建身体。你不能从身体重建大脑。

在控制室内:

在每个 Agent 的运行时中,位于 /srv//data/:

三种交互方式

  • 控制路径 是元层。用于添加 Agent、审查文档、检查端口、轮换密钥、调试设置。
  • 直接路径 是最快的。用于你已经知道哪个 Agent 做这项工作。
  • 编排路径 是合成器。用于你想要一个前门,将多个专业的工作路由并组合起来。

层级1:单一 Agent

你只有一个 Hermes Agent。仅此而已。控制室仍然可以存在(推荐),但只记录那个 Agent。
最适合:初始设置、你的个人 Hermes、根安装文档、简单的 Docker 迁移。
一个 Agent,已经运行一段时间,拥有你调整过的个性和已经开始构建的记忆。用你想要的语调填充 SOUL.md,用关于你业务的稳定事实填充 MEMORY.md,用关于你的稳定事实填充 USER.md。将其连接到 Telegram 或 Discord,这样它就在你所在的地方。开始在实际任务上使用它。让它接触你的工具。让它沿途编写自己的技能。
MEMORY.md 保存稳定事实(你的业务是什么、你的客户是谁、你的产品做什么)。USER.md 保存关于你的稳定事实(时区、工作时间、重复项目、首选输出格式)。两者每周都会在你与 Agent 进行真实对话并纠正它时得到精炼。

层级2:直接专业 Agent

你有多个专业 Agent,但你仍然直接与每个对话。还没有编排器。控制室记录所有这些。
最适合:明确的角色分离、测试哪些 Agent 有用、避免过早编排、将凭证范围限定在每个 Agent 内。

需要避免的陷阱是:在你证明专业 Agent 有用之前就急于使用编排器。先启动两三个,直接运行它们,只有当你发现自己想要一个前门时才添加编排器。

何时启动新 Agent 与坚持现有 Agent:
不好的模式:一个巨型 Agent,将每个凭证和每个记忆层混在一起。你会失去隔离,无法干净地撤销访问权限,Agent 也会对使用哪个语调感到困惑。

层级3:编排器 + 专业 Agent

你添加 hermes-orchestrator 作为前门。你仍然可以直接与专业 Agent 对话,但编排器可以路由工作并合成结果。编排器读取控制室。

相似文章

NousResearch/hermes-agent

GitHub Trending (daily)

Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。

@KanikaBK: https://x.com/KanikaBK/status/2053845110048293272

X AI KOLs Timeline

本文提供了一份逐步指南,用于安装和配置 Hermes Agent。Hermes Agent 是由 Nous Research 开发的一款开源、具备自我改进能力的 AI 智能体。内容涵盖系统要求、通过终端安装、连接 Telegram 等消息网关,以及与各大大型语言模型(LLM)服务商的集成。