@ScottyBeamIO: https://x.com/ScottyBeamIO/status/2066885278451519590
摘要
Hermes Agent 是一个云端AI代理,持续运行并通过消息交互。它具有自我改进循环,从对话中提取模式以增强记忆和技能,并且拥有简化的设置和灵活的模型路由。
查看缓存全文
缓存时间: 2026/06/17 05:48
Hermes Agent 完全指南:架构、安装与自我进化循环
AI 工具领域正悄然兴起一个新类别:这些智能体不再存在于你打开又关闭的聊天窗口中,而是持续在云端运行,通过即时通讯工具与你对话,就像一个永不掉线的同事。Hermes 是这类理念中较为有趣的实现之一,它与 OpenClaw 等同类智能体的关键区别在于内置的自我进化循环——一个持续观察对话、从中提取有用模式,并将这些模式转化为永久性记忆和技能升级的系统。本文将详细解析 Hermes 的架构、配置方法,以及自我进化循环的实际运行机制。
Hermes 是什么,它与 OpenClaw 有何不同
Hermes 是一个云端驻留的 AI 智能体,结构上与 OpenClaw 类似:它 24/7 运行,你通过即时通讯应用而非终端或浏览器标签页与之交互。主要区别有三点。首先,Hermes 开箱即用自带更大的内置技能库,省去大量手动配置集成的时间。其次,安装过程更加流畅——一个引导式 TUI 几乎能处理所有步骤。第三,也是最重要的一点,Hermes 围绕持续自我改进设计:它不仅能执行任务,还会积累关于如何更好地执行任务的程序性知识。
安装与初始配置
让 Hermes 运行只需一条命令。
在 Windows 上,请在 PowerShell 中执行:
iex (irm https://hermes-agent.nousresearch.com/install.ps1)
在 Linux、macOS 或 WSL 上,等效命令为:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
安装完成后,重启终端并运行 hermes setup,即可启动引导式配置流程,依次进行模型选择、终端后端、消息网关和工具配置。
选择与路由模型
配置中第一个关键决策是哪个 LLM 提供商作为智能体的“大脑“。认证方式通过 OAuth 而非原始 API 密钥,这意味着你可以通过已有的 Claude Code 或 Codex CLI 会话登录,而无需生成单独的 API 密钥。
Hermes 的设计亮点在于将主对话使用的模型与后台及辅助任务的模型分开。默认情况下,两者使用同一模型,但每个辅助任务都可以独立指向不同的提供商。
支持此类覆盖的任务包括:
- vision – 图像分析与描述
- web_extract – 总结长网页
- compression – 压缩溢出的对话上下文
- title_generation – 生成会话标题
- curator – 负责自我改进循环的后台智能体
- kanban_decomposer – 在看板模式下将大任务拆分为子任务
- goal_judge – 检查
/goal是否实际达成的智能体
此配置直接在 config.yaml 中完成,例如:
# 用于聊天和复杂推理的主要模型
model:
provider: "anthropic"
default: "claude-4-8-sonnet"
auxiliary:
vision:
provider: "gemini"
model: "gemini-2.5-flash"
compression:
provider: "custom"
base_url: "http://localhost:11434/v1"
api_key: "none"
model: "qwen2.5:32b"
这种显式路由解决了将 OpenRouter 作为默认选择时的一个实际问题:同一名义模型往往由多个提供商部署,且量化方式不同,OpenRouter 会静默地将每个新请求随机分配到大约二十个实例之一。实际效果是,在单个会话中,你并非在与一个一致的模型对话——而是在与一系列配置各异的实例轮流对话,其中一些实例处理工具调用和提示词模板的可靠性更高。在 Hermes 内部手动路由可完全避免此问题。
另外值得注意的是,如果你想在不牺牲编码质量的情况下节省对话模型的费用,Hermes 支持 /claude_code 和 /codex 命令,这些命令将编码任务直接委托给这些 CLI 工具,而非使用配置的聊天模型来处理。
终端后端
架构的核心部分是终端后端环境,它决定了 shell 命令和 Python 脚本的实际执行位置,以及智能体访问文件系统的方式。Hermes 支持五种后端。
- Local 是默认选项。命令直接在本地机器上以当前用户权限运行——无隔离。适用于本地开发和可信的个人使用场景,你希望智能体直接编辑实际项目文件。安全性完全依赖内置的审批系统,该系统会拦截破坏性命令(如
rm -rf /、DROP TABLE)并在执行前请求明确许可。 - Docker 将智能体运行在隔离沙箱内,使其无法接触宿主机系统。
- SSH 让智能体通过远程连接在远程服务器上执行命令和处理文件。
- Modal 在无服务器云沙箱中运行所有内容——本质上是按秒租用计算资源,仅为你代码实际运行的秒数付费。
- Daytona 是专为 AI 编码智能体设计的容器管理层;它比直接运行 Docker 更快,并能自动处理环境设置和依赖安装。
对于大多数个人使用场景,Local 完全足够——其他选项主要在你运行不可信代码或团队级部署时才有意义。
消息网关与工具配置
终端后端之后,配置进入选择实际与智能体对话的地方——Telegram 是最完善的选项。选择它会提供一个直接链接,用于启动预配置的机器人;无需手动设置 Bot Token。
剩余的配置步骤涉及启用各个工具及其对应的提供商——浏览器自动化、图像生成、文本转语音和网页搜索。对于网页搜索,自托管的 Firecrawl 或 Exa 是面向智能体的抓取和检索的优秀选择。X 搜索需要 Grok 订阅才能启用,这一点在菜单中寻找之前值得了解。
值得关注的斜杠命令
Hermes 附带了大量斜杠命令,多数从名称即可理解其用途,但有几个值得特别提及。
/background在后台运行任务,不中断主会话。/goal设置一个智能体持续追求的长期目标,附带暂停、恢复、清除或检查状态的子命令;/subgoal管理嵌套在当前目标下的较小目标。/kanban协调跨多个独立智能体的异步、长期工作——功能类似于实际看板,任务池分配给工作智能体,并在它们之间传递,经过待办、进行中和已完成状态。- 在开发方面,
/github_pr_workflow处理从分支到合并的完整周期(包括 CI),/github_code_review审查拉取请求,/codebase_inspection分析仓库的语言分布和代码行数。 /dogfood是一个专用 QA 模式,用于在 Web 应用中寻找错误并生成有证据支持的报告。/spike运行快速的一次性实验,以验证想法再投入完整开发。/systematic_debugging分四个阶段处理错误,在尝试修复之前理解根本原因。- 还有一系列集成特定的命令——
/notion、/obsidian、/airtable、/google_workspace、/arxiv、/blogwatcher、/polymarket、/ocr_and_documents、/youtube_content——每个封装了特定的外部服务或工作流,以及/bundles,它通过小型 YAML 配置文件将多个现有技能组合到一个斜杠命令下。
定时任务与 Webhook
两种自动化原语值得特别关注。
- 定时任务 让你定时调度脚本运行;如果在创建时传递
-no-agent,Hermes 将仅执行纯 Python 或 bash 脚本,并将输出转发到你的即时通讯工具,完全不消耗 LLM Token。 - Webhook 是更强大的部分:它们让智能体响应外部事件而非定时器。你可以配置一个 webhook,例如,当新的 GitHub 拉取请求出现时,自动触发一个带有特定提示词和技能集的智能体——相当于为每个 PR 自动部署一个随叫随到的审查智能体,无需任何手动干预。
上下文引擎
上下文引擎控制 Hermes 在对话历史接近模型 Token 限制时如何进行压缩和管理,有两个选项。
- 默认的 Compressor 对长对话的中间部分进行有损摘要。
- 另一种选择是 LCM(无损上下文管理),采用结构上不同的方法:它不生成文本摘要,而是构建一个对话关键点的有向无环图,让智能体可以从高度压缩的概览视图向下导航到支持它的具体原始消息。
记忆引擎
外部记忆提供商与 Hermes 内置的本地记忆文件(MEMORY.md 和 USER.md)一同运行,增加了语义搜索和知识图谱等功能。
有几种可以直接通过配置 TUI 进行设置。
- Honcho 围绕构建详细的用户画像,使用后台 LLM 调用来合成两个层面的观察:基础层包括会话摘要和画像,辩证层则分析用户当前需求。
- OpenViking 是一个上下文数据库,构建类文件系统的知识层级,支持分级上下文检索,并在每次会话结束时自动将提取的事实分类到六个类别——事件、模式、偏好等。
- Mem0 是一个完全托管的云记忆服务;事实提取在服务器端通过 LLM 完成,包括语义搜索、结果重排序和自动去重,但由于是云托管,它也是这里唯一具有持续成本的选项。
- Hindsight 是一个更高级的长期记忆系统,基于 GraphRAG 风格的知识图谱。它从会话中提取实体,建立它们之间的关系,并保留完整的对话回合(包括工具调用),记忆分为四类:关于世界的事实、智能体自身经验、观点和观察。
- Holographic 是一个本地、基于 SQLite 的事实存储,无外部依赖,包括对存储事实的可信度评分系统,并使用全息约简表示支持代数、组合查询,还能自动检测知识库中的矛盾。
- RetainDB 是一个用于团队记忆的云 API,提供向量、BM25 和重排序方法的混合搜索,记忆分为七种不同类型,并使用差分压缩保持存储高效。
- ByteRover 是一个便携式本地记忆系统,通过 CLI 访问,构建层级知识树,并在有损压缩有机会丢弃重要事实之前将其提取出来。
- Supermemory 提供带有图 API 的语义长期记忆:它在对话结束后摄取完整会话日志以构建知识图谱,定期清理已回忆的事实以避免当前轮次污染,并可以将记忆隔离到每个智能体配置文件的独立容器中。
对于日常使用,默认的本地记忆对大多数人来说确实足够——更重的系统用实际的资源成本(尤其是本地托管选项的内存)来换取大多数工作流尚不需要的能力。
自我进化循环
这是 Hermes 与常规智能体最显著的区别:一组异步后台进程持续分析你的对话,提取有用模式,并将这些模式写入长期记忆和程序性记忆(技能)——然后维护这些积累的知识,使其不会随时间衰减。
整个系统与主聊天并行运行,由三个组件构成:触发系统、后台审查智能体和策展人。
-
触发系统 Hermes 不会实时分析每一条消息,因为那样会无益地消耗 Token。相反,它依赖两个计数器,当它们超过阈值时触发一次反思。一个记忆触发器每十次用户提示触发,检查对话中是否出现了值得保存的新事实。一个技能触发器每十次工具调用迭代(在单个回合内)触发,基于这样的理论:如果智能体刚刚花了这么多步骤通过试错解决问题,那么这次经历值得分析并可能转化为可重复使用的技能。一旦任一计数器达到限制,一个内部函数就会被触发,将当前对话的快照交给后台审查进程。
-
后台审查智能体 这个快照被交给一个完全独立、隔离的智能体进程,它在后台并行运行,不会中断你的主会话。它双向工作。
- 在声明性方面,如果它注意到新的用户偏好或环境细节——例如偏好 Supabase、项目固定使用 Python 3.12——它会更新
MEMORY.md或USER.md,具体取决于该事实属于哪个文件。 - 在程序性方面,如果它检测到智能体刚刚解决了一个非平凡问题或理清了一个复杂流程,它可以创建一个新技能、编辑现有技能、应用针对性补丁或直接删除一个技能。它创建的任何技能都会被明确标记为智能体生成,因此来源始终可追溯。
为了让策展人最终判断哪些自我生成的技能值得保留,Hermes 维护一个隐藏的使用日志,针对每个技能跟踪:它被加载到提示词中的次数、智能体打开它阅读的次数、它被编辑的次数,以及创建、最后使用和最后编辑的时间戳。
- 在声明性方面,如果它注意到新的用户偏好或环境细节——例如偏好 Supabase、项目固定使用 Python 3.12——它会更新
-
策展人 如果不加控制,这个过程最终可能产生数百个技能,其中一些冗余,一些过时。策展人负责防止知识库退化。它仅在两个条件同时满足时启动:距离上次运行已过去足够时间(默认七天),且主智能体空闲时间足够长(默认两小时),这样一次繁重的维护不会干扰正在进行的工作。在进行任何更改之前,它会自动备份整个技能目录,因此任何不满意的结果都可以通过一条终端命令回滚。
策展人的工作分两个阶段:
- 第一阶段纯粹是机械性的,完全不涉及 LLM 调用:它检查使用指标,将超过 30 天未使用的智能体生成技能标记为已弃用,并将超过 90 天未使用的技能移至归档文件夹。重要技能可以显式固定以保护它们免受此过程影响。
- 第二阶段是真正的 LLM 审查,通过一个单独隔离的智能体实例运行,使用为策展人辅助任务配置的模型——默认与主对话相同,但可以指向更便宜的模型。不过在此处过于节俭需要谨慎,因为这些决策的质量对技能库有实际的下游影响。对于每个技能,策展人决定:如果仍然准确有用则保留原样;如果包含错误或过时方法则修复;如果与另一个覆盖基本相同内容的技能合并(正确迁移相关的脚本、评估或参考文件,并重写相对路径);或者直接归档。在循环结束时,它会生成一份详细报告,包括一个重命名映射,精确显示旧技能名称如何对应到新名称。
相似文章
@PrajwalTomar_: https://x.com/PrajwalTomar_/status/2064324584254710262
Nous Research 的 Hermes Agent 是一款开源自主 AI 代理,它在服务器上持续运行,跨会话记住每一次对话,并自主创建技能文件,使其与 Claude Code 和 Cursor 等基于会话的编码工具截然不同,属于一个根本不同的代理类别。
@RoundtableSpace: HERMES AGENT 是最早真正能够跨会话记住所有内容并且越用越好的人工智能项目之一……
Hermes Agent 被宣传为一款具有多层记忆、自我进化技能、全天候自主运行以及跨会话回忆能力的 AI 项目,其定位更像是一位运营者而非工具。
NousResearch/hermes-agent
Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。
@tavilyai:Hermes Agent 让我们得以一窥智能体的未来走向——它从每次会话中学习,自主编写技能,并持续构建记忆…
Nous Research 推出的 Hermes Agent 是一款开源自进化自主智能体,能够从每次会话中学习并随时间积累持久记忆。Tavily 作为其网络搜索后端接入,旨在提升搜索质量,防止错误数据在智能体的长期记忆与技能库中不断累积放大。
@akshay_pachaar: https://x.com/akshay_pachaar/status/2054564519280804028
Nous Research 推出的 Hermes Agent 综合指南,重点介绍其技能自进化、三层记忆架构以及用于构建持久化 AI 智能体的 GEPA 优化能力。