@intheworldofai: Hermes Agent 正在快速发展。就在过去一周内,Nous Research 增加了:- 完整的 WebUI/桌面应用 - 后台计算…
摘要
Nous Research 发布了开源 Hermes Agent 的重要更新,新增了原生 macOS 后台电脑使用功能、通过看板进行多智能体编排,以及 Lightpanda 浏览器集成。
查看缓存全文
缓存时间: 2026/05/13 10:20
Hermes Agent 正在飞速进化。仅仅在过去一周,Nous Research 就添加了:
- 完整的 WebUI/桌面应用
- macOS 后台电脑操控功能
- 多智能体编排
- Hermes 看板(Kanban)升级
- Lightpanda 浏览器后端支持
- Nous Portal 免费使用 Qwen2.5-Plus
- 更强大的自主工作流
- 持久化长期记忆系统
Hermes 开始感觉不再仅仅是一个 AI 工具,而更像是一个真正的开源 Agentic AI 操作系统。 详细解析/演示:https://youtu.be/Gx2joHxUhgg
TL;DR: Hermes Agent 近期迎来重大更新,新增了后台电脑操控功能、集成了 Light Panda 浏览器后端、支持 Qwen 2.5 模型,并引入了基于看板的多智能体编排系统与长期目标(Goal)命令,使其成为一个强大的持久化自主 AI 系统。
Hermes Agent 快速进化:新功能深度解析
Hermes Agent 正在以惊人的速度迭代。作为目前最引人注目的开源 AI 智能体项目之一,它在多项日常 AI 智能体排行榜中已超越 OpenClaw、Pod Code 和 Kilo Code 等工具。由 Nous Research 基于 MIT 许可证构建,Hermes 被设计为一个持久的自主系统,能够在自有基础设施上 7x24 小时运行。随着使用时间的推移,它不仅能构建长期记忆和可复用技能,还能深化对自身系统的理解。
本周,Hermes 迎来了大规模更新,涵盖了从原生电脑操控支持到全新的多智能体编排系统。以下是核心更新的详细解读。
后台电脑操控功能 (Computer Use)
此次更新中最引人注目的功能是原生电脑操控支持。该功能由 KUA 驱动,处于早期预览阶段,允许 Hermes 控制实际电脑,且几乎兼容任何 AI 模型,不仅限于那些拥有专属“电脑操控模式”的前沿模型。
非侵入式后台运行
这一实现的核心优势在于其完全在后台运行。与传统的屏幕共享或光标接管不同,Hermes 不会完全控制你的 PC。在智能体工作的同时,用户仍可正常使用键盘、鼠标、应用程序及工作流。这种设计在实现实用自主工作流的同时,保留了对个人工作环境的控制权。
跨平台支持
目前,后台电脑操控功能仅限 macOS,但 Windows 和 Linux 版本即将推出。
- 操作方式:智能体可以在用户继续浏览网页的同时,在操作系统层面点击、输入、滚动并操作应用程序。
- 模型兼容性:由于 Hermes 不依赖特定模型的专有 API,任何具备视觉语言模型 (VLM) 能力且支持工具调用的模型均可使用此功能,包括 Claude、GPT-4o、GPT-5、Gemini 以及本地开源模型。这被视为类似 Codeex 风格后台电脑操控的开源等效方案。
安装与启用
用户可以通过以下两种方式启用该功能:
- CLI 安装:在终端运行
hermes computer use install命令进行原生安装。 - 交互式启用:运行
hermes tools并选择电脑操控功能。
集成 Light Panda 浏览器后端
为了解决 AI 智能体网页访问的复杂性(如拼凑搜索 API、无头浏览器、抓取工具等),Hermes 集成了 Light Panda——一个专为机器和 AI 工作流构建的开源浏览器后端。
- 默认后端:Light Panda 可设为默认浏览器后端。
- 自动回退:在需要时,系统会自动回退到 Chrome 支持。
- 可靠性提升:这一集成为浏览器自动化、智能体工作流以及 Hermes 内部自主网页任务的整体可靠性带来了巨大改进。
多智能体编排与看板系统 (Kanban)
Hermes 不再仅仅是一个独立的 AI 工具,而是演变为一个持久的自主工作空间,具备多智能体操作环境。
无限看板与订阅
新增的看板功能允许用户创建无限数量的看板项目。通过配置的门控信使 (gateway messenger),用户可以直接在主频道中订阅项目更新。这意味着可以一次性协调多个智能体完成不同任务,并通过看板进行统一管理。
设置步骤
- 更新客户端:在终端运行
hermes update确保 Hermes 为最新版本。 - 初始化看板:复制 Hermes 看板初始化命令并粘贴到终端。
- 启动 Web UI:复制 Hermes 仪表板命令并运行,启动 Web 界面。
- 管理任务:在左侧面板查看插件,即可在看板中管理和组织所有多智能体操作,追踪任务状态(待处理、进行中、已完成等)。
长期目标命令 (/goal)
Hermes 新增了类似 Codeex 和 Claude Code 的 /goal 命令。
- 自主目标模式:不同于单次提示,
/goal命令启动长时间自主目标模式。 - 持续循环:智能体将持续进行规划、执行、审查,并在遇到故障时重试。
- 子任务管理:智能体将自主管理子任务,直到最终目标真正完成。
- 记忆与移交:该命令管理编排记忆,并在不同智能体之间移交任务,所有状态均通过上述看板进行跟踪。
模型支持:Qwen 2.5
阿里巴巴的 Qwen 2.5 系列模型(特别是 Qwen 2.5 Plus/Coder 等变体,原文提及 Qwen 3.6 可能为口误或特定内部版本引用,此处指代最新强力 Qwen 模型)现已直接在 Nous Portal 中可用,并在有限时间内免费。
- 性能优势:Qwen 在 Web 开发、长上下文工作流(支持百万级 Token 上下文窗口)以及多模态任务方面表现卓越。
- 集成优势:Nous Portal 构建在 OpenRouter 之上,提供所有 OpenRouter 模型路由的优势,以及专为 Hermes 优化的独家免费模型、折扣和捆绑工具使用。
- 访问方式:前往 Nous Research 网站创建账户即可访问免费层级的模型。
其他功能更新
- 语音克隆:支持使用 XES 自定义语音行作为 TTS 提供商进行语音克隆。
- 多语言支持:Hermes 可使用多种语言进行交流,并支持 Google Chat 集成。
- 桌面应用:新增了完整的 WebUI 和桌面应用程序支持,提升了用户体验。
总结
Hermes Agent 的此次更新极大地增强了其作为开源自主智能体的能力。通过后台电脑操控、集成 Light Panda 浏览器、强大的多智能体看板以及长期目标管理,Hermes 正在成为一个能够自我改进、长期运行且高度可控的生产力系统。随着 Windows 和 Linux 支持的即将加入,其适用范围将进一步扩大。
来源:Hermes Agent is evolving FAST… (https://www.youtube.com/watch?v=Gx2joHxUhgg&feature=youtu.be)
相似文章
@NousResearch: Hermes Agent 的下一次进化来了!推出 Hermes Desktop:你所喜爱的 Hermes 的一切,现在原生运行在……
NousResearch 发布了 Hermes Desktop,这是其 Hermes Agent 的桌面原生版本,在 Jensen 的 GTC 主题演讲中演示后,现已进入公开预览阶段。
NousResearch/hermes-agent
Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。
@_vmlops: HERMES Agent 刚刚发布了一个桌面应用,用于大规模管理自主 AI 智能体。你现在可以:- 运行多个智能体 …
HERMES Agent 发布了一款桌面应用,允许用户从单一界面管理多个自主 AI 智能体,具备持久化内存和长期运行的工作流自动化功能。
@0xJeff: https://x.com/0xJeff/status/2066883577141428563
Hermes Analyst 获得重大更新,包括重新设计的用户界面/用户体验、更简单的代理配置、用于改进研究的嵌套编排器、Hermes Desktop 和 Windows 版本发布,以及与 Stripe 的集成。
@Saboo_Shubham_: 有人刚刚开源了 Hermes Agent 的 Web 界面。现在你可以通过浏览器使用 Hermes,完全拥有终端级别的功能。1…
Hermes Agent 的 Web 界面已开源,支持通过浏览器使用,并完全兼容终端功能。