@tavilyai:Hermes Agent 让我们得以一窥智能体的未来走向——它从每次会话中学习,自主编写技能,并持续构建记忆…
摘要
Nous Research 推出的 Hermes Agent 是一款开源自进化自主智能体,能够从每次会话中学习并随时间积累持久记忆。Tavily 作为其网络搜索后端接入,旨在提升搜索质量,防止错误数据在智能体的长期记忆与技能库中不断累积放大。
查看缓存全文
缓存时间: 2026/05/09 09:43
Tavily
来源:https://www.tavily.com/blog/hermes-agent-web-search-how-to-wire-tavily-into-a-self-improving-agent
内容摘要
- Hermes Agent(https://hermes-agent.nousresearch.com/)是 Nous Research(https://nousresearch.com/)推出的一款开源自我改进型 Agent,运行在用户自主控制的基础设施上,并能从每次会话中持续学习。
- 其 Web 工具集提供三个工具——web_search、web_extract 和 web_crawl——均通过单一可配置后端进行路由。若要接入 Tavily,只需在初始配置时选择即可。
- 由于 Hermes 能够将每次工具调用结果持久化到记忆、全文搜索索引以及自动生成的技能中,Web 后端在这里的影响范围远比无状态 Agent 更大。一次失败的内容提取不只是当次任务失败——它会被汇总写入 MEMORY.md,或被编译成未来会话所调用的技能。
- Tavily 有两种接入方式:作为原生 Web 后端,以及作为 MCP 服务器或 CLI/技能包,为规划器的工具箱增添研究和站点映射能力。
什么是 Hermes Agent?
Hermes Agent(https://hermes-agent.nousresearch.com/)是 Nous Research 推出的一款开源自主 Agent,属于快速兴起的自托管个人 AI Agent 运行时这一类别。与同类产品 OpenClaw(https://github.com/openclaw/openclaw)或 ZeroClaw(https://github.com/zeroclaw-labs/zeroclaw)类似,它并非绑定在 IDE 上的编程副驾,也不是套在单一 API 外面的聊天机器人封装。它是一个长期运行的进程,可以部署在任意位置——5 美元的 VPS、Docker 容器、可通过 SSH 访问的服务器,或者 Daytona、Modal 等 Serverless 基础设施——并通过你接入的任意消息平台与你通信(Telegram、Discord、Slack、WhatsApp、Signal、iMessage、Email、CLI 等,全部通过统一网关进行桥接,且支持的平台列表仍在持续增加)。
Hermes Agent 运行时拓扑——左侧为用户,中间为具有持久状态的 Agent 运行时,右侧为 LLM 提供商,下方为系统访问层(终端、Web 工具、浏览器)它采用 MIT 协议授权,与模型无关(支持 Nous Portal、OpenRouter、OpenAI、Anthropic、Google Gemini、Token Factory(https://tokenfactory.nebius.com/)、本地 Ollama——任何兼容 OpenAI 接口的端点均可),并明确设计为运行在用户自主控制的基础设施上。无需托管 SaaS,无供应商锁定,完整的会话状态存储在 ~/.hermes/ 目录下。自项目发布以来,GitHub Star 数已突破 10 万,发布节奏大约为每周一次。
让 Hermes 区别于大多数 Agent 框架的核心特性是其学习循环。当 Hermes 完成一项复杂任务后,它可以将新技能写入磁盘,并在下次遇到类似任务时直接调用。随着会话的积累,“API 背后的通用 LLM“就逐渐演变为“了解我的习惯、项目和解题方式的 Agent”。
这一循环也正是 Web 后端选择比一般情况更加重要的原因,我们稍后会详细说明。
Hermes 的 Web 工具是如何工作的
Hermes 的 Web 工具集绑定了三个工具,供规划器组合使用:
三者通过 ~/.hermes/config.yaml 中的 web.backend 字段统一路由至同一后端。若该字段未设置,Hermes 会根据 ~/.hermes/.env 中存在的 Provider Key 自动检测。
整个流程就是这样:search 返回链接,extract 读取内容,crawl 遍历站点。
Hermes 的 Web 流水线路由——规划器调用 web_search、web_extract 和 web_crawl,所有调用都汇入单一可配置的后端插槽。该插槽可由四个受支持后端之一填充。
Web 后端选项
来自 Hermes 配置文档(https://hermes-agent.nousresearch.com/docs/user-guide/configuration#web-search-backends):
这张表的结构至关重要。如果选择了不支持 web_crawl 的 Provider,Agent 编写的任何调用该工具的技能都将无法加载——文档站点扫描、竞争对手域名审计、全域名内容摄取等操作均无法执行。规划器有时会尝试用 web_search 加一批 web_extract 调用来变通,但这种方式受制于搜索结果数量,而非主题覆盖范围,最终得到的语料库也是不完整的。
为何它处于一切的上游
在无状态 Agent 中,一次失败的 Web 结果只会导致当前任务失败,然后就消失了。而在 Hermes 中,每次工具调用都处于三个持久化子系统的上游,这些子系统在大多数会话结束后都会运行:
- MEMORY.md 和 USER.md。 两个由 Hermes 长期维护并根据会话内容更新的 Markdown 文件,在每次会话开始时都会注入系统提示词。
- FTS5 全文索引。 基于 SQLite 的搜索层,覆盖所有历史对话。Agent 在处理任何可能与以往工作相关的内容之前,都会先查询该索引。
- 自动生成的技能。 当一项任务涉及五次或更多工具调用时,Agent 可进入反思阶段:分析自己的执行轨迹,提取可复用的模式,并写入一个 SKILL.md 文件。技能会在推理前被优先查询——规划器更倾向于调用已知有效的流程,而非重新推导解决方案。该格式遵循 openagentskills.io(https://agentskills.io/)标准,因此相同的技能可在 Claude Code、Cursor、OpenClaw 及其他生态系统中通用。
这种复利效应正是关键所在——同时也是故障模式的根源。当 web_extract 返回的是导航栏 HTML 和“加载中…“占位符,而非文章正文时,这些输出仍然会被汇总写入记忆条目或编译成技能。循环无法区分好坏。三周后,Agent 会自信地调用一个充满错误内容的列并据此执行操作。一次被持久化的空白提取,是一种会无声无息地滚雪球的故障模式。
两条并行时间线,展示单次 web_extract 结果如何在数周内持续传播。
Web 后端是整个系统中影响范围最大的部分。今天返回的内容,决定了 Agent 下周会调用什么。
Tavily 为 Hermes 的 Web 流水线带来了什么
Tavily 以两种不同方式接入 Hermes,解决不同层面的问题,且可以同时运行。
从 Hermes 规划器到 Tavily API 的两条路径,均终止于 Tavily API,且可同时运行。
1. 作为原生 Web 后端
设置 web.backend: tavily 后,规划器已有的 web_search、web_extract 和 web_crawl 调用将通过 Tavily 进行路由。规划器随之获得三方面的改变:
- 为 Agent 读取结果而构建的搜索,而非面向人类浏览 SERP 的搜索。 Tavily 的 web_search 将 topic、time_range、country 以及 include_domains/exclude_domains 过滤器作为一等 API 字段暴露出来。规划器可以直接控制内容的时效性和域名范围,而无需将其拼接进查询字符串。这种精度至关重要,因为下次会话的记忆检索将对规划器拉取到的内容进行索引。
- 针对长尾页面优化的内容提取。 web_extract 提供高级模式,可处理 JS 渲染、反爬机制和表格密集型页面——这些长尾场景被错误地汇总到记忆中时代价最高。普通 HTTP 抓取器在这类页面上往往返回导航栏 HTML,毫无实际价值。
2. 作为 MCP 服务器或 CLI/技能包
原生 Web 工具集绑定了三个工具,而 Tavily 的 API 还额外提供了两个 Hermes 核心工具集默认未暴露的端点:
- /research —— 单次调用即可完成多来源合成,并保留各观点对应的内联引用。
- /map —— 域名 URL 图谱审计,返回域名的链接图,无需为你不关心的页面支付提取开销。
这两者均可作为规划器可见的工具使用,方式有二:通过 Hermes 的 MCP 客户端注册 Tavily MCP 服务器(https://docs.tavily.com/documentation/mcp),或通过 Tavily CLI(https://docs.tavily.com/documentation/tavily-cli)安装 Tavily Agent Skills(https://docs.tavily.com/documentation/agent-skills)包。两种方式赋予规划器相同的组合能力,区别在于规划器发现工具的方式:
两者可以同时使用。MCP 路径在规划器已知目标工具时保持流程紧凑;技能路径则让规划器能够从一个从未提及 tavily-research 的提示词中自行发现它需要这个工具。
你可以用它构建什么
将这一切整合起来的价值在于:Hermes 内置了无每日运行次数限制的 cron 调度器、消息网关层,以及最多并行分发给三个子 Agent 的能力。结合 Tavily 的功能集,这些能力可以转化为规划器能够编译成技能的具体使用模式:
时间窗口监控。 Cron + topic + 时效性过滤,足以运行每周竞争对手提及摘要、对指定供应商域名列表进行每日发版说明扫描,或者每周一的 AI 新闻早报。Agent 将所见内容持久化到记忆中,后续运行会跳过已知内容。
选择性摄取:map → 过滤 → extract。 当你只需要文档站点中有变化的页面时,先运行 tavily_map 获取 URL 图谱,与上周的快照进行对比过滤,再只对新增内容执行提取。接入 Tavily MCP 或 CLI 后,Hermes 即可具备这一能力。
单次调用的带引用研究报告,按时推送。 tavily_research 返回带有完整来源映射的合成简报。将其接入 cron 调度器和 Telegram 或 Slack 网关,你就拥有了一个按计划向你推送可溯源简报的研究助理。引用关系在简报被纳入记忆后仍保留完整的审计链路。
配置步骤
安装 Hermes Agent
在 Linux、macOS 或 Windows(通过 WSL2)上安装 Hermes:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装程序会将项目克隆到 ~/.hermes/,创建 Python 虚拟环境,并将 hermes 命令添加到你的 PATH 中。重新加载你的 Shell(执行 source ~/.zshrc 或 source ~/.bashrc)。
将 Tavily 设置为 Web 后端
运行交互式配置向导:
当向导进入 Web 后端配置步骤时,选择 Tavily:
Hermes Agent 配置界面——已选择 Tavily 作为 Web 后端
如果你已经完成 Hermes 配置并希望切换后端,请编辑以下两个文件:
``
~/.hermes/config.yaml
toolsets:
- hermes-cli
- web
web: backend: tavily ``
``
~/.hermes/.env
TAVILY_API_KEY=tvly-… ``
完成。通过以下命令验证配置:
hermes config show hermes
(可选)添加 Tavily MCP 服务器
若要在此基础上叠加 MCP 服务器,在同一配置文件的 mcp_servers 下添加以下内容:
``
~/.hermes/config.yaml
mcp_servers: tavily: url: https://mcp.tavily.com/mcp/ auth: oauth ``
(可选)安装 Tavily CLI 和 Agent Skills
运行以下命令安装 CLI 和 Agent Skills 包:
``
安装 tvly 二进制文件
curl -fsSL https://docs.tavily.com/install.sh | bash
安装程序会询问是否安装 Tavily skills 包
也可以手动安装 Tavily skill
npx skills add tavily-ai/skills –all ``
重启 Hermes 后,/tools 将显示新增的工具——原有的 web_* 工具集,加上来自 MCP 的 tavily_* 工具,以及覆盖核心端点和动态过滤(https://www.tavily.com/blog/dynamic-filtering-let-the-model-program-its-own-search-filters)功能的 Tavily 技能。
结语
Web 后端选择在 Hermes 中比在无状态 Agent 中更加重要,原因在于每次结果都会进入记忆、FTS5 索引,或被编译成技能。Agent 在未来会话中所依赖的底层数据,正是今天后端所返回的内容。选择一个覆盖范围不受限制、内容提取足够干净的后端,确保持久化的底层数据来自真实内容,自我改进循环就会朝着对你有利的方向持续复利。
立即尝试。 获取 Tavily API Key(https://tavily.com/)(免费套餐每月 1,000 个 Credits),将其配置为 Web 后端,并设置一个 cron 任务,使用 topic: news、time_range: week 参数,每周一运行一次 AI 新闻早报。
常见问题
我可以同时运行多个后端吗?
原生 Web 工具集只能绑定单一后端。但你可以在任意其他后端之上叠加 Tavily MCP 服务器——规划器将同时看到配置的 Web 后端提供的 web_search/web_extract/web_crawl,以及 MCP 工具提供的 tavily_search/tavily_extract/tavily_crawl/tavily_map/tavily_research。如果你希望使用 Tavily 的 research 和 map 端点而不改变现有 Web 配置,这是最灵活的方案。
我需要同时安装 MCP 服务器和 CLI 技能包吗?
不需要,任意一种方式都足以使用 /map 和 /research。MCP 服务器会将它们作为始终在线的工具暴露给规划器,在每次对话轮次中均可见;CLI + 技能包则会将它们保留在上下文之外,直到某个提示词匹配到技能的 frontmatter 时才激活。如果你需要两者兼顾,也可以同时使用。
我可以导入 OpenClaw 的技能吗?
可以。Hermes 和 OpenClaw 均遵循 agentskills.io(http://agentskills.io/)标准,因此为某一个编写的 SKILL.md 文件可以直接放入另一个的技能目录并正常运行。Tavily 技能可以在两种运行时中以相同方式安装。
我可以离线运行 Hermes 吗?
可以——将其指向一个上下文窗口至少为 64K 的本地 Ollama 模型,Agent 循环即可在无需联网的情况下运行。Web 工具集显然需要网络连接,但集成并非全有或全无;离线会话仍可受益于记忆、技能和 cron 调度器。
Hermes 是免费开源的吗?
是的。采用 MIT 协议,源代码托管于 GitHub(https://github.com/NousResearch/hermes-agent)。你在自己的基础设施上运行,无需支付任何许可费用——你只需为接入的模型 API 和 Web 后端付费。Tavily 的免费套餐(每月 1,000 个 Credits)足以在评估阶段完整运行该集成。
我在哪里获取 Tavily API Key?
在 tavily.com(https://tavily.com/)注册即可获得免费 API Key。免费套餐为每月 1,000 个 Credits。
相似文章
@gregisenberg:一步步配置 Hermes agent,内置记忆、40+ 工具、手机可用,以及 Hermes 与 OpenClaw 的对比
Hermes 是一款运行在终端的个人 AI agent,内置记忆与 40+ 工具,支持手机端,并与 OpenClaw 进行对比。
@Saboo_Shubham_: 这太疯狂了!Hermes Agent 团队(@NousResearch)正在将 X 评论转化为数小时内即可使用的完整功能。10倍构建者…
Nous Research 强调其 Hermes Agent 平台能够快速将原始想法转化为完全可用的功能,将 AI 智能体定位为开发者生产力的新标准。
@Teknium:有趣的洞见,尤其是这句:Hermes 刚起步时和任何智能体一样低效,常常不知道该如何完成训练时没先验的任务……
Teknium 观察到,Hermes 智能体最初表现低效,但一旦成功解决某个任务,效率就会大幅提升,他将其比作“线性化 RL”。
@smantena: https://x.com/smantena/status/2052483819270521238
本文提供了关于集成 Hermes、GBrain 和 Notion 以创建个性化 AI 助手的详细技术指南,该助手可自动管理任务并综合知识。
@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2052836621905510541
# Hermes Agent v0.13.0("韧性版本")发布:持久看板、目标持久化与检查点回滚 Hermes Agent v0.13.0 正式发布,代号"The Tenacity Release"(韧性版本),本次更新带来了持久化看板(Durable Kanban)、持久目标(Persistent Goals)、Checkpoints v2(含回滚功能)以及 8 项 P0 级安全修复,将自身定位为与 Claude Code、Codex 等编码智能体并肩的**运行时持久层**。此次发布恰逢 DeepSeek V4-Pro、MiMo-V2.5-Pro 等支持百万级上下文窗口的低成本模型相继推出,使长期运行的智能体软件变得更具可行性。 ## 核心新特性 ### 持久看板(Durable Kanban) 任务状态不再随会话结束而丢失。看板数据现可跨会话持久保存,智能体可在中断后无缝恢复工作流,无需从头重建任务上下文。 ### 持久目标(Persistent Goals) 智能体的长期目标现在可以跨越多个会话持续存在。这意味着用户无需在每次启动时重新向智能体说明意图,系统能够自主维护目标状态并持续推进执行。 ### Checkpoints v2(含回滚) 升级后的检查点系统引入了**回滚能力**,允许将智能体状态恢复至任意历史检查点。这对于长时间运行的任务尤为关键——一旦某个执行分支出现错误,可直接回退而无需从零重启。 ### 8 项 P0 级安全修复 本次版本针对最高优先级安全漏洞进行了全面修复,共解决 8 个 P0 级问题,进一步强化了生产环境下的部署安全性。 ## 定位:运行时持久层 Hermes Agent 将自身明确定位为**运行时持久层**,与 Claude Code、Codex 等以代码生成为核心的编码智能体形成互补,而非竞争。其核心价值在于为智能体提供可靠的状态管理与执行连续性,解决长期任务中"断点续跑"这一关键工程问题。 ## 时机:百万上下文模型降低门槛 此次发布的时机颇具战略意义。随着 DeepSeek V4-Pro 和 MiMo-V2.5-Pro 等支持百万 token 上下文窗口的模型以极低成本落地,长时间运行的智能体任务从理论走向实践的障碍正在迅速消除。上下文容量的扩展与持久化基础设施的成熟,共同构成了**长期智能体软件**规模化应用的两大前提条件,而 Hermes Agent v0.13.0 正是在这一窗口期及时补上了基础设施侧的关键拼图。