@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2052836621905510541
摘要
# Hermes Agent v0.13.0("韧性版本")发布:持久看板、目标持久化与检查点回滚 Hermes Agent v0.13.0 正式发布,代号"The Tenacity Release"(韧性版本),本次更新带来了持久化看板(Durable Kanban)、持久目标(Persistent Goals)、Checkpoints v2(含回滚功能)以及 8 项 P0 级安全修复,将自身定位为与 Claude Code、Codex 等编码智能体并肩的**运行时持久层**。此次发布恰逢 DeepSeek V4-Pro、MiMo-V2.5-Pro 等支持百万级上下文窗口的低成本模型相继推出,使长期运行的智能体软件变得更具可行性。 ## 核心新特性 ### 持久看板(Durable Kanban) 任务状态不再随会话结束而丢失。看板数据现可跨会话持久保存,智能体可在中断后无缝恢复工作流,无需从头重建任务上下文。 ### 持久目标(Persistent Goals) 智能体的长期目标现在可以跨越多个会话持续存在。这意味着用户无需在每次启动时重新向智能体说明意图,系统能够自主维护目标状态并持续推进执行。 ### Checkpoints v2(含回滚) 升级后的检查点系统引入了**回滚能力**,允许将智能体状态恢复至任意历史检查点。这对于长时间运行的任务尤为关键——一旦某个执行分支出现错误,可直接回退而无需从零重启。 ### 8 项 P0 级安全修复 本次版本针对最高优先级安全漏洞进行了全面修复,共解决 8 个 P0 级问题,进一步强化了生产环境下的部署安全性。 ## 定位:运行时持久层 Hermes Agent 将自身明确定位为**运行时持久层**,与 Claude Code、Codex 等以代码生成为核心的编码智能体形成互补,而非竞争。其核心价值在于为智能体提供可靠的状态管理与执行连续性,解决长期任务中"断点续跑"这一关键工程问题。 ## 时机:百万上下文模型降低门槛 此次发布的时机颇具战略意义。随着 DeepSeek V4-Pro 和 MiMo-V2.5-Pro 等支持百万 token 上下文窗口的模型以极低成本落地,长时间运行的智能体任务从理论走向实践的障碍正在迅速消除。上下文容量的扩展与持久化基础设施的成熟,共同构成了**长期智能体软件**规模化应用的两大前提条件,而 Hermes Agent v0.13.0 正是在这一窗口期及时补上了基础设施侧的关键拼图。
查看缓存全文
缓存时间: 2026/05/09 11:47
这个周末你应该安装 Hermes Agent
廉价的百万上下文模型改变了模型层,Claude Code 和 Codex 改变了编码层,而 Hermes 正在成为运行时层。
把它当作 Claude Code 的竞争对手是个误区。更实用的方式是将 Hermes 与 Claude Code 或 Codex 并排使用。Hermes 正逐渐成为一个运行时层,在对话结束后仍能维持长期软件工作的持续运转。
Nous Research@NousResearch·5月8日 Hermes Agent v0.13.0 - “韧性版本” 1442322.3K1.2M
Hermes Agent v0.13.0 于 5 月 7 日发布,7 天内完成了 864 次提交、588 个 Pull Request、295 名贡献者,并修复了 8 个 P0 级安全问题!上一个版本共有 1,096 次提交。
这个周末值得测试它,原因在于三个层次同时发生了变化:更廉价的百万上下文模型已被证明能承受真实的 Agent 工作负载,更强大的编码 Agent,以及一个专注于持久性而非演示功能的 Hermes 新版本。
核心摘要
- 本周末安装 Hermes v0.13,将其作为 Claude Code 或 Codex 旁边的运行时层,而非替代品。
- 本次更新内容: 持久化看板、持久化 /goal 命令、Checkpoints v2 与 /rollback 回滚、网关自动恢复、写后 lint 检查、8 个 P0 安全修复。
- 周末测试方案: 在一个真实仓库上完成一次真实的测试失败清理。到周一为止:一个仓库、一个目标、一条模型路由、开启 Checkpoint、修复一条失败测试路径。
- 推荐服务商: OpenCode Go 将 DeepSeek V4-Pro 和 MiMo-V2.5-Pro 打包在一个 API Key 后面,首月 $5,之后 $10。
周边层发生了哪些变化
DeepSeek V4-Pro 于 2026 年 4 月 24 日上线,支持 1M 上下文,目前 5 月 31 日前享受 75% 折扣,输入价格 $0.435/百万 token,输出 $0.87/百万 token。
MiMo-V2.5-Pro 在 OpenRouter 上以 MIT 协议提供,输入 $1/百万 token,输出 $3/百万 token,同样支持 1M 上下文。在 SWE-bench Verified 上得分 78.9,TerminalBench 2.0 上得分 68.4。
OpenCode Go 将以上两个模型打包为订阅制,首月 $5,之后 $10。这一上下文长度的模型访问门槛正在降低。
Claude Code 和 Codex 是大多数团队已在使用的最强前台编码工具。运行时层则是开发者尝试将这些工具用于真实工作时最先遇到瓶颈的地方:对话结束了,上下文消失了,目标被遗忘了,错误的编辑留了下来,模型路由还停留在一小时前的配置,仓库规范也没有被继承。
这正是 Hermes 要攻克的层。
本次“韧性版本“更新内容
Hermes Agent v0.13.0,标签 v2026.5.7,在 Curator 版本发布一周后上线。功能命名读起来就像一个运行时系统:持久化看板、持久化 /goal、Checkpoints v2、网关自动恢复、写后 lint、安全加固、Provider 插件化。
看板(Kanban) 是基于本地 SQLite 的持久化任务板,专为跨越 Agent 边界、重启和人工交接的工作而设计。Worker 以完整的 OS 进程运行,拥有独立身份。心跳机制证明存活状态,心跳超时触发任务回收,僵尸检测捕获停止响应的 Worker。每个任务有独立的重试预算,防止无限循环。完成验证关卡(hallucination-recovery gate)在任务关闭前核实完成声明,捕获那些声称“已完成“但补丁实际上从未落地的 Worker。
Teknium @Teknium·5月5日
Hermes 看板现在支持无限数量的看板/项目,你还可以订阅项目更新,将消息推送到你设置的网关通讯工具的主频道!运行 hermes update 即可。
49681K187K
看板作为任务板本身并不特别有趣,有趣的是它作为 Agent 工作的存活层。
An Engineer’s Log@an_engineer_log·22小时前 你的 AI Agent 处理单个任务效果很好。但要并行管理 20 个任务呢?Cron 作业悄悄失败,任务被卡住,你花在“盯守“上的时间比实际产出还多。我构建了 Minions——一个用于 Hermes Agent 的开源任务控制中心,自动监督每一个运行中的任务。 17918632K
/goal 设定一个持久目标并启动第一轮对话。每轮对话结束后,辅助裁判模型检查目标是否已完成。若未完成,Agent 继续执行,最多 20 轮。子命令包括 /goal status、/goal pause、/goal resume、/goal clear。状态保存在 session 数据库中,并在 /resume 后依然存在。
大多数 Agent 只记得最后一条消息,而 Hermes 试图记住任务目标本身。
Checkpoints v2 重写了状态持久化机制,加入了真正的清理和磁盘保护。快照在 write_file、patch 以及破坏性终端命令执行前自动创建。/rollback 列出所有检查点;/rollback <N> 恢复到第 N 个检查点并撤销最后一轮对话;/rollback diff <N> 预览差异;/rollback <N> <file> 恢复单个文件。
网关自动恢复在重启和源文件重新加载后保持 session 存活。
本次版本还修复了 8 个 P0 级安全问题:密钥脱敏默认开启;Discord 角色白名单限定在 guild 范围内,修复了 CVSS 8.1 的跨 guild 私信绕过漏洞;WhatsApp 默认拒绝陌生人;auth.json 和 MCP OAuth 的 TOCTOU 竞争窗口已关闭。
这些修复在将 Hermes 作为自托管网关暴露给聊天应用时最为重要。对于纯本地开发,默认开启的密钥脱敏是最直接的改变。
长期 Agent 工作中那些枯燥的基础设施问题,在这一个版本中统一交付。
Hermes 此前已有的能力
大多数 Agent 演示只能撑十分钟,难的是第十一分钟。当一个真实软件任务完成到一半时,Agent 必须记住目标、继承仓库规范、将工作路由到合适的模型、回滚错误编辑、调度后台检查、在速率限制中存活,并将专项工作交给最擅长的前台编码工具。
在 v0.13 之前,Hermes 已经覆盖了大部分这些场景:
- 读取 .hermes.md、AGENTS.md、CLAUDE.md 和 .cursorrules,并随着工具访问新目录深入仓库
- 支持 7 种终端后端:本地、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox
- 支持 26+ 个服务商,包括 Anthropic、OpenCode Go、OpenRouter、GitHub Copilot 以及任何 OpenAI 兼容端点
- 以两种模式运行 Cron 作业:完整 Agent 运行模式,或 no_agent 纯脚本守护模式(零 LLM token 消耗)
- 在某个 Key 触发速率限制时,在多个凭证池间轮换
- 作为 MCP 服务器暴露自身,以便 Claude Code 或 Cursor 读取其消息状态
- 暴露 delegate_task 用于短暂的同步子任务(不需要看板那样的持久化开销)
上周的 Curator 版本新增了 7 天周期的自主技能维护。上周解决了技能衰退,本周转向了工作持久性。
一个无法回滚的编码 Agent,不是开发工具,而是一个带有自信的补丁生成器。
这不是替代方案的推介,这是一个层次的推介。
那么,什么应该放在 Claude Code 旁边
Hermes 为 Claude Code 和 Codex 内置了技能包,它们不是竞争关系,而是 Hermes 将实现工作委托给的前台编码工具。每个技能支持两种模式:用于结构化任务的一次性打印模式,以及用于多轮重构的交互式 tmux 模式。
用例的划分是最清晰的解释方式:
如果任务是“我盯着你改这个文件“,Claude Code 或 Codex 可能是更好的工具。如果任务是“跨越模型、Worker、调度、内存、Checkpoint 和消息渠道,保持这个仓库工作流持续运转“,Hermes 就成为更有价值的那一层。
当瓶颈是编排框架而非一次性代码生成时,Hermes 可以比 Claude Code 或 Codex 更强大。
如何在本周末真实仓库上实际使用
这里不是安装教程,安装命令在文末附录中。本节重点是第一个工作流。
Hermes 运行起来后最有价值的问题是:该做什么?
一个工作流可以在单次通过中演练整个运行时:在真实仓库上完成一次真实的测试失败清理。它在一次扫描中涉及仓库上下文、终端命令、Checkpoint、写后 lint、Provider 路由和 Worker 委托。
进入仓库并启动 Hermes:
如果仓库有 AGENTS.md、CLAUDE.md 或 .cursorrules,Hermes 会在第一轮加载它。如果没有,写一个简短的 .hermes.md,包含测试命令、代码风格规范,以及何时修测试、何时修代码的判断规则。
设置目标:
/goal 修复这个仓库中的失败测试。运行测试命令,识别最小失败范围,每次只打一个安全的补丁,直到测试命令全部通过。在有风险的编辑前使用 Checkpoint。
重点是观察 Hermes 能否运行测试命令、识别失败项,并安全地打补丁。每次 write_file 或 patch 前会先创建 Checkpoint,每次 Python、JSON、YAML 或 TOML 写入后触发增量 lint,裁判模型在每轮结束后检查目标是否完成。遇到糟糕的编辑,用 /rollback <N> 回滚,或先用 /rollback diff <N> 预览差异。
对于多个并行失败,建立一个看板:
每个任务以独立 OS 进程启动一个 Worker,心跳证明存活,僵尸被回收,重试次数有预算上限。
实际代码编写部分,使用委托(delegate):Hermes 内置的技能包将工作交给 Claude Code、Codex 或 OpenCode,可选一次性打印模式或用于多轮重构的交互式 tmux session。
Hermes 维持编排框架,前台 Worker 编写代码。
使用 OpenCode Go 作为服务商。首月 $5 的订阅将 DeepSeek V4-Pro 和 MiMo-V2.5-Pro(以及更多优秀模型)整合在一个 Key 后面。根据工作负载侧重代码编辑还是 Agent 工具调用,在两个模型间切换。OpenCode Go 的消费上限为每 5 小时窗口 $12、每周 $30、每月 $60,长期清理工作请规划好备用 Key。
按照 OpenCode 文档修改 Hermes 中存储的默认端点。
周一的目标很简单:Hermes 能读取一个仓库、持有一个目标、使用一条模型路由、创建 Checkpoint,并在不丢失上下文的情况下帮助清理一条失败测试路径。
适合安装 vs. 建议等待
适合安装,如果你已经每天使用 Claude Code 或 Codex,希望工作流在对话关闭后仍能存活,并且想测试持久目标、Checkpoint 和持久化看板是否真的改变了真实仓库的工作方式。一次安装、一个服务商配置、一次真实的测试失败清理,就是整个周末的计划。
建议等待,如果生产级管控、成熟的审计追踪,或零配置摩擦比运行时层的收益更重要。
macOS 用户使用 Python 3.13 会遇到安装冲突;Docker 用户会遇到 Node 版本不匹配和 .venv 权限问题;远程终端后端有已知的环境变量透传 bug;Discord 不支持受限网络的代理;原生 Windows 暂不支持(即将推出),但可以使用 WSL。
/goal 使用裁判模型,因此完成状态判断可能出错,目标可能在实际完成前被标记为已完成,或在应该关闭后仍保持开启。
Hermes v0.13 是“韧性“,不是“生产就绪“。请将安装视为一次认真的测试,而非正式部署。
OpenClaw 有更响亮的市场号召力:370,000+ GitHub Stars、ClawHub 注册表、50+ 消息渠道。Hermes 押注的方向不同:更少的“再装一个技能“时刻,更多围绕目标、Worker、内存、Checkpoint 和 Provider 路由的持久运行时机制。赌注不同,但同属一个品类。
编码 Agent 的下一次有价值的跃升,可能不是更聪明的模型,而是在对话窗口关闭后仍能保持工作存活的运行时层。Hermes Agent v0.13 目前看来是填补这一空白的最强可安装方案。
相关链接
- https://github.com/NousResearch/hermes-agent
- https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7
- https://hermes-agent.nousresearch.com/docs/
关注 @AlphaSignalAI 获取更多类似内容。 另外,欢迎查看我们的 Harness Engineering 工作坊,共 30 个席位,每位 $150。 在 AlphaSignal.ai 订阅,获取每日 AI 动态,已有 28 万+ 开发者在读。
附录:安装命令
单条 curl 安装命令,仅支持 macOS 或 Linux,Windows 请使用 WSL2,不支持原生 Windows。
# 1. 安装 Hermes
# 2. 配置服务商 + 前台 Worker
就这些。
如需完整的配置流程,包括服务商 OAuth 授权、消息平台接入和 Docker 后端配置,官方文档 https://hermes-agent.nousresearch.com/docs/ 是权威参考。
相似文章
@PrajwalTomar_: https://x.com/PrajwalTomar_/status/2064324584254710262
Nous Research 的 Hermes Agent 是一款开源自主 AI 代理,它在服务器上持续运行,跨会话记住每一次对话,并自主创建技能文件,使其与 Claude Code 和 Cursor 等基于会话的编码工具截然不同,属于一个根本不同的代理类别。
@akshay_pachaar: https://x.com/akshay_pachaar/status/2054564519280804028
Nous Research 推出的 Hermes Agent 综合指南,重点介绍其技能自进化、三层记忆架构以及用于构建持久化 AI 智能体的 GEPA 优化能力。
@nateherk: https://x.com/nateherk/status/2053308681299616125
本文详细介绍了 Hermes——由 Nous Research 构建的一个开源 AI Agent 框架,它专注于内存、技能以及用于即时自动化的自我改进循环。
@ScottyBeamIO: https://x.com/ScottyBeamIO/status/2066885278451519590
Hermes Agent 是一个云端AI代理,持续运行并通过消息交互。它具有自我改进循环,从对话中提取模式以增强记忆和技能,并且拥有简化的设置和灵活的模型路由。
NousResearch/hermes-agent
Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。