@shannholmberg: https://x.com/shannholmberg/status/2055335043904492011
摘要
Hermes Agent 是 NousResearch 开发的一款开源自主智能体框架,能够端到端地运行工作流,包括浏览器导航、终端命令和任务调度。本文提供了关于如何设置并使用它进行营销自动化的全面指南。
查看缓存全文
缓存时间: 2026/05/16 17:21
如何成为 Hermes Agent 操作员
学习如何操作并掌握 Hermes Agent。设置 Agent 控制室模板,配置专业 Agent,从单一 Agent 成长为一台 VPS 上的完整营销公司。
大多数 AI 工具只是回答问题。Hermes Agent 端到端地执行你的工作流。它能操作你的浏览器、执行终端命令、调度 cron 任务、监控你的收件箱、起草工作,并将结果发布到你所在的任何地方:Telegram、Discord、Slack、你当前正在参与的邮件线程。由 @NousResearch 构建,开源,拥有 150,000 个 GitHub Star。目前在 OpenRouter 上全球 Token 使用量排名第一。
这就是我过去几周构建整个营销运营所依赖的框架,而你现在正在阅读的文章,如果我今天从零开始,我会如何设置它。
你将在这篇文章中学到什么
- Hermes Agent 是什么,以及为什么营销人员(不仅仅是开发者)应该关注它
- 对读者友好的架构解读:大脑、个性、技能集,以及它们如何共存于一个文件夹中
- 我目前正在 Hermes 上运行的实际用例,附四篇相关文章
- 四部分心智模型(你、控制室、Agent、可选的任务总线)以及四个设置层级,从“笔记本电脑上的一个 Agent”到“完全自动化的多 Agent 团队,你可以在 VPS 上通过手机控制”
- 我用来将营销工作流从混乱想法变为自主部署的原型 → 生产方法论
- 我希望能从第一天就拥有的资源:文档、社区地图、值得关注的人、正在进行的线下活动
- 诚实的权衡以及它仍然会失效的地方
我在这篇文章中不推销任何东西。Hermes 是开源的,Nous Portal 提供免费层,社区生态系统大部分也是免费的。Fork 它、修改它、让它成为你自己的。
Hermes Agent 是什么
简短版: 一个自主 Agent,运行时间越长,能力越强。
详细版: Hermes 是由 Nous Research 构建的框架,它将模型转变为持久操作员。它拥有自己的记忆,可以在对话轮次之间存活。它在工作时会自己编写技能。它内置了 123 项技能(GitHub 工作流、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、以及 100+ 更多)。它可以在你放置的任何地方运行:笔记本电脑、Docker 容器、VPS、Serverless 运行时。你可以通过 20+ 种方式与它对话:Telegram、Discord、Slack、邮件、语音模式,或者直接使用终端。
Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于:
它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
显示更多
引用
Shann3@shannholmberg·5月10日
1:51
Nate Herk 刚刚写出了互联网上最详尽的 Hermes Agent 设置指南
这里有 12 条教训,你在构建自己的 Agent 之前需要了解
x.com/19216745449994…4697714242K
如果你用过 Claude Code 或 OpenClaw,Hermes 在形态上类似,但理念不同。
Hermes 像 Rails。有意见的默认配置,电池包含在内,第一天就能高效工作,只需最少的设置,Agent 会为你做更多的思考。
OpenClaw 像 Linux。原语、保证、显式控制,Agent 完全按照你告诉它的去做,不做更多。
两者都有效。我运行 Hermes 是因为它捆绑的默认配置会产生复利。我启动的每个 Hermes 项目中,Agent 在我写一行配置之前就已经知道如何做 100+ 件事。这个先发优势对我来说值得。
我还注意到 Hermes 几乎不会有 Gateway 断开或出错的问题。
证据就在 Nous Research 刚刚达成的数字中:
- OpenRouter 全球 Token 使用量排名第一(平台上的所有模型和框架中)
- Hermes 仓库 150,000 个 GitHub Star
- 123 项内置技能,Agent 自己编写技能之前
- Gateway 中 70+ 内置工具,外加通过一个订阅接入 300+ 模型
- 6 个部署目标:本地、Docker、SSH、Daytona、Singularity、Modal
- 20+ 消息界面:Telegram、Discord、Slack、邮件、语音
如果你是一个 AI 营销人员,还没有开始运行 Hermes,你每周都在把复合能力留在桌上。
它是如何工作的(对读者友好的版本)
每个 Hermes Agent 有三个部分。
一个大脑。 记忆存储在 ~/.hermes/memories/ 中。两个文件,MEMORY.md 和 USER.md,在会话启动时注入。你的语调准则、品牌笔记、客户语言、上周的修正,所有这些都在第一个提示之前加载。会话存储在 SQLite 中,跨会话的回忆可以通过全文搜索实现。
一个个性。 soul.md 是氛围存放的地方。简洁、讽刺、直率、正式、快速或深思熟虑。你可以启动六个 Agent,给每个不同的灵魂,共享同一个大脑。一个是你的对外代表,有成交者的能量;另一个是你的研究员,喜欢长句子;还有你的助理,保持一切简短。
一组技能集。 开箱即用的 123 项技能:GitHub PR、Obsidian、Google Workspace、Linear、Notion、Typefully、Perplexity、深度研究、浏览器控制、网页抓取、视觉、语音、调度。以及闭环学习:Agent 在工作时会沿途编写新技能。你自己的技能库会在那 123 项之上增长,而你无需编写任何技能。
然后是 Agent 可以与之对话的东西。
- 工具 Gateway:一个订阅,300+ 模型,外加内置的网页抓取和浏览器自动化
- MCP 集成:任何支持模型上下文协议的外部服务都会变成 Agent 可以使用的工具
- 20+ 消息界面:Telegram、Discord、Slack、邮件、语音,加上 CLI 本身
以及 Agent 可以运行的地方。
- 你的笔记本电脑(本地)
- 一个 Docker 容器(隔离、可移植,我用的方式)
- VPS 上的 SSH 会话(即使合上笔记本电脑也能运行)
- Daytona、Singularity、Modal(如果你不想管理基础设施,可以使用 Serverless)
闭环学习是它区别于智能聊天机器人的关键。Agent 观察自己的工作,在了解你工作形态时编写新技能,定期精炼记忆,并通过全文搜索和 LLM 摘要结合的方式跨会话回忆过去上下文。你不必下周再重新教它。
我告诉刚接触 Hermes 的人一条规则:第一天不要试图编写自己的技能。运行真正的工作,让 Agent 观察,让 harness 去编写技能。通过工作构建自定义技能库比通过编写提示更快。
我在 Hermes 上运行什么
我是一个 AI 营销人员,不是编码员。我在 Hermes 上运行的大部分是营销基础设施,偶尔有内部工具。以下是实际列表:
- 一个个人助手,处理商务和私人事务,运行在 Telegram 上,每天早上标记四封值得阅读的邮件,安排提醒,总结我错过的会议
- 一个营销工作流原型台,我在这里测试新的流程(营销磁石、广告创意审查、内容冲刺),在推广之前针对实际工作运行 2-3 次
- 专业的营销 Agent:SEO、对外/BD、设计审查、内容写作,每个都有自己独特的灵魂和作用范围
- 一个公司大脑,监控 Slack、聊天、邮件、转录、语音备忘录,让所有内容都可查询。当我问“上个月我们对那个客户关于定价说了什么?”时,3 秒内得到答案,而不是 30 分钟的挖掘
- 一个 SEO Agent,在一个 Docker 容器中运行从关键词种子到发布文章的完整管道,21 个步骤,无需人工介入直到最终审查
- 一个内容分发 Agent,将一篇长文(比如本文)分解并发布到 LinkedIn、X、Threads,带有平台特定的钩子
- 一个编排 Agent,本身不产生工作,只根据我的请求将任务路由到正确的专业 Agent
我发布的总结蓝图:
Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层,所有容器都在一台 VPS 上的隔离 Docker 容器中:
- 公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
- 编排 Hermes Agent – 读取公司大脑,选择正确的部门……
显示更多
引用
Shann3@shannholmberg·5月13日
Hermes Agent 改变了我的工作方式
它是目前你可以设置的最高杠杆的 Agent 框架
它的不同之处在于:
它根据复杂性和成本将任务路由到正确的模型
随时间学习你的语调和偏好
处理上下文切换而不会……
x.com/14559993134531…541081K133K
特别是 SEO Agent 值得深入探讨,因为它是我公开发布过的,也是最符合本文架构的。五层,全部在一个 Docker 容器内,21 个步骤,从关键词种子到发布文章。这 21 个步骤在终端中看起来像这样:
该管道之上的层级:
- 公司大脑 在顶部:愿景、品牌、受众、产品。每个 Agent 都从中读取
- 编排 Hermes Agent:获取主题或关键词种子,将其路由到 SEO Agent
- SEO 脑:排名剧本、语调规则、内容格式、视觉风格指南、每种格式的成功标准。所有 SEO 特定的上下文都存于此
- SEO Agent 内的三个子 Agent,每个处理一个阶段:
- 研究 + 构思:关键词种子、SERP 快照、竞争对手提取、意图和格式分析、内容和视觉差距、内部和外部验证
- 生产:角度和定位简报、视觉策略简报、大纲、草稿、图像生成、流程图生成、视觉和文章质量检查
- 分发:发布准备、Schema、内部链接、联合、分析、监控
- 一个 Docker 容器 包含所有三个子 Agent。它们共享环境、记忆和工具。子配置文件根据阶段切换上下文。一个进程、一个文件系统、一套凭证。
为什么用一个容器而不是三个:SEO 工作是顺序的。研究为简报提供信息,简报为生产提供信息,生产为分发提供信息。每一步都需要记住上游决策。拆分为三个容器意味着需要跨边界传递状态,这既昂贵又容易中断链路。
公司中其他每个专业 Agent 都运行在相同的模板上。克隆 SEO Agent 模板,交换大脑(SEO 脑 → 对外脑,或设计脑,或支持脑),你就得到了一个在任何功能上都相同五层形状的新 Agent。
Shann3@shannholmberg·5月15日
在组织架构图中我的 Hermes SEO Agent 如何工作
它运行从关键词种子到发布文章的完整管道,21 个步骤,全部在一个 Docker 容器内
结构:
第1层:公司大脑
共享上下文:愿景、品牌、受众、产品。每个 Agent 都从中读取
显示更多
引用
Shann3@shannholmberg·5月13日
我的 Hermes Agent 公司的组织架构图
四层,所有容器都在一台 VPS 上的隔离 Docker 容器中:
- 公司大脑 – 愿景、品牌、客户、产品。其他每一层继承的上下文
- 编排 Hermes Agent – 读取公司大脑,选择正确的部门……
x.com/14559993134531…101419414K
这些层级不是装饰。它们是 Agent 在工作变得专业化时不丢失上下文的原因。公司大脑保持稳定,而工人迭代。大脑层级让工人可替代。
我最近还在里斯本的 @EspressioAI 总部为 Nous Research 举办了一场 Hermes Agent 之夜。@yeahfortommy 来自 Nous,主持了问答环节,noticed.so 的 Simao 展示了一个带有自动研究的 Agent harness,而我则讲解了我们在 Espressio 如何使用 Hermes 实现增长。
Shann3@shannholmberg·4月27日
我们正在 @Espressio 总部为 @NousResearch 举办 Hermes Agent 之夜
@touchgrassklub 正在与 Talent Protocol 合作组织
以下是当晚的议程:
我将首先介绍如何使用 Hermes Agent 实现增长,我们在……
显示更多
1144723K
如果你在里斯本,想参加下一次活动,我会在安排时间后发布通知。
从一个 Agent 到完整舰队
在层级之前,先讲心智模型。设置包含四个部分:
- 你 是操作员。你可以直接访问系统的每个部分。
- Agent 控制室 是侧边控制面板。它不是你可以通过它聊天的 Agent。它是一个文件夹,位于 /root/vps-agents,记录并管理整个舰队。你可以打开它、编辑它、检查它,或者在管理系统时让 Claude、Codex 或 Hermes 使用它。
- Hermes Agents 是工人。有些是专业化的(SEO、开发、CMO、运营)。其中一个可以可选地成为编排器。
- Agent 任务总线 是一个可选的交接台,位于编排器和专业 Agent 之间。只有当你有编排器在运行时才需要它。
整体看起来像这样:
存储拆分比人们想象的更重要:
控制室包含以下问题的答案:存在哪些 Agent、它们做什么、使用哪些端口、引用哪些凭证、每个 Agent 能做什么不能做什么、以及如何重启、调试或重建任何一个。
实时运行时包含实际的工作内容。
控制室是定义系统的大脑。实时运行时是运行系统的身体。你可以从大脑重建身体。你不能从身体重建大脑。
在控制室内:
在每个 Agent 的运行时中,位于 /srv/
三种交互方式
- 控制路径 是元层。用于添加 Agent、审查文档、检查端口、轮换密钥、调试设置。
- 直接路径 是最快的。用于你已经知道哪个 Agent 做这项工作。
- 编排路径 是合成器。用于你想要一个前门,将多个专业的工作路由并组合起来。
层级1:单一 Agent
你只有一个 Hermes Agent。仅此而已。控制室仍然可以存在(推荐),但只记录那个 Agent。
最适合:初始设置、你的个人 Hermes、根安装文档、简单的 Docker 迁移。
一个 Agent,已经运行一段时间,拥有你调整过的个性和已经开始构建的记忆。用你想要的语调填充 SOUL.md,用关于你业务的稳定事实填充 MEMORY.md,用关于你的稳定事实填充 USER.md。将其连接到 Telegram 或 Discord,这样它就在你所在的地方。开始在实际任务上使用它。让它接触你的工具。让它沿途编写自己的技能。
MEMORY.md 保存稳定事实(你的业务是什么、你的客户是谁、你的产品做什么)。USER.md 保存关于你的稳定事实(时区、工作时间、重复项目、首选输出格式)。两者每周都会在你与 Agent 进行真实对话并纠正它时得到精炼。
层级2:直接专业 Agent
你有多个专业 Agent,但你仍然直接与每个对话。还没有编排器。控制室记录所有这些。
最适合:明确的角色分离、测试哪些 Agent 有用、避免过早编排、将凭证范围限定在每个 Agent 内。
需要避免的陷阱是:在你证明专业 Agent 有用之前就急于使用编排器。先启动两三个,直接运行它们,只有当你发现自己想要一个前门时才添加编排器。
何时启动新 Agent 与坚持现有 Agent:
不好的模式:一个巨型 Agent,将每个凭证和每个记忆层混在一起。你会失去隔离,无法干净地撤销访问权限,Agent 也会对使用哪个语调感到困惑。
层级3:编排器 + 专业 Agent
你添加 hermes-orchestrator 作为前门。你仍然可以直接与专业 Agent 对话,但编排器可以路由工作并合成结果。编排器读取控制室。
相似文章
NousResearch/hermes-agent
Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。
@KanikaBK: https://x.com/KanikaBK/status/2053845110048293272
本文提供了一份逐步指南,用于安装和配置 Hermes Agent。Hermes Agent 是由 Nous Research 开发的一款开源、具备自我改进能力的 AI 智能体。内容涵盖系统要求、通过终端安装、连接 Telegram 等消息网关,以及与各大大型语言模型(LLM)服务商的集成。
@nateherk: https://x.com/nateherk/status/2053308681299616125
本文详细介绍了 Hermes——由 Nous Research 构建的一个开源 AI Agent 框架,它专注于内存、技能以及用于即时自动化的自我改进循环。
@intheworldofai: Hermes Agent 正在快速发展。就在过去一周内,Nous Research 增加了:- 完整的 WebUI/桌面应用 - 后台计算…
Nous Research 发布了开源 Hermes Agent 的重要更新,新增了原生 macOS 后台电脑使用功能、通过看板进行多智能体编排,以及 Lightpanda 浏览器集成。
@itsolelehmann:为你的智能体赋予超能力的顶级Hermes集成:1. Firecrawl 基本上是为智能体构建的网页搜索。它……
精选的Hermes AI智能体顶级集成列表,包括Firecrawl、Browserbase、Google Workspace、Reddit、YouTube、Discord、GitHub、Stripe、Bland/Twilio、Apify、Readwise、Granola/Fathom和Obsidian,为智能体赋予网页搜索、交互、效率和研究方面的超能力。