@intheworldofai: Hermes Agent 正在快速发展。就在过去一周内,Nous Research 增加了:- 完整的 WebUI/桌面应用 - 后台计算…

X AI KOLs Timeline 产品

摘要

Nous Research 发布了开源 Hermes Agent 的重要更新,新增了原生 macOS 后台电脑使用功能、通过看板进行多智能体编排,以及 Lightpanda 浏览器集成。

Hermes Agent 正在快速发展。就在过去一周内,Nous Research 增加了: - 完整的 WebUI/桌面应用 - macOS 上的后台电脑使用功能 - 多智能体编排 - Hermes 看板升级 - Lightpanda 浏览器后端支持 - Nous Portal 中免费的 Qwen3.6-Plus - 更优的自主工作流 - 持久化长期记忆系统 Hermes 开始感觉不再像是一个 AI 工具,而更像一个真正的开源 Agentic AI 操作系统。详细解析/演示:https://youtu.be/Gx2joHxUhgg
查看原文
查看缓存全文

缓存时间: 2026/05/13 10:20

Hermes Agent 正在飞速进化。仅仅在过去一周,Nous Research 就添加了:

  • 完整的 WebUI/桌面应用
  • macOS 后台电脑操控功能
  • 多智能体编排
  • Hermes 看板(Kanban)升级
  • Lightpanda 浏览器后端支持
  • Nous Portal 免费使用 Qwen2.5-Plus
  • 更强大的自主工作流
  • 持久化长期记忆系统

Hermes 开始感觉不再仅仅是一个 AI 工具,而更像是一个真正的开源 Agentic AI 操作系统。 详细解析/演示:https://youtu.be/Gx2joHxUhgg


TL;DR: Hermes Agent 近期迎来重大更新,新增了后台电脑操控功能、集成了 Light Panda 浏览器后端、支持 Qwen 2.5 模型,并引入了基于看板的多智能体编排系统与长期目标(Goal)命令,使其成为一个强大的持久化自主 AI 系统。

Hermes Agent 快速进化:新功能深度解析

Hermes Agent 正在以惊人的速度迭代。作为目前最引人注目的开源 AI 智能体项目之一,它在多项日常 AI 智能体排行榜中已超越 OpenClaw、Pod Code 和 Kilo Code 等工具。由 Nous Research 基于 MIT 许可证构建,Hermes 被设计为一个持久的自主系统,能够在自有基础设施上 7x24 小时运行。随着使用时间的推移,它不仅能构建长期记忆和可复用技能,还能深化对自身系统的理解。

本周,Hermes 迎来了大规模更新,涵盖了从原生电脑操控支持到全新的多智能体编排系统。以下是核心更新的详细解读。

后台电脑操控功能 (Computer Use)

此次更新中最引人注目的功能是原生电脑操控支持。该功能由 KUA 驱动,处于早期预览阶段,允许 Hermes 控制实际电脑,且几乎兼容任何 AI 模型,不仅限于那些拥有专属“电脑操控模式”的前沿模型。

非侵入式后台运行

这一实现的核心优势在于其完全在后台运行。与传统的屏幕共享或光标接管不同,Hermes 不会完全控制你的 PC。在智能体工作的同时,用户仍可正常使用键盘、鼠标、应用程序及工作流。这种设计在实现实用自主工作流的同时,保留了对个人工作环境的控制权。

跨平台支持

目前,后台电脑操控功能仅限 macOS,但 Windows 和 Linux 版本即将推出。

  • 操作方式:智能体可以在用户继续浏览网页的同时,在操作系统层面点击、输入、滚动并操作应用程序。
  • 模型兼容性:由于 Hermes 不依赖特定模型的专有 API,任何具备视觉语言模型 (VLM) 能力且支持工具调用的模型均可使用此功能,包括 Claude、GPT-4o、GPT-5、Gemini 以及本地开源模型。这被视为类似 Codeex 风格后台电脑操控的开源等效方案。

安装与启用

用户可以通过以下两种方式启用该功能:

  1. CLI 安装:在终端运行 hermes computer use install 命令进行原生安装。
  2. 交互式启用:运行 hermes tools 并选择电脑操控功能。

集成 Light Panda 浏览器后端

为了解决 AI 智能体网页访问的复杂性(如拼凑搜索 API、无头浏览器、抓取工具等),Hermes 集成了 Light Panda——一个专为机器和 AI 工作流构建的开源浏览器后端。

  • 默认后端:Light Panda 可设为默认浏览器后端。
  • 自动回退:在需要时,系统会自动回退到 Chrome 支持。
  • 可靠性提升:这一集成为浏览器自动化、智能体工作流以及 Hermes 内部自主网页任务的整体可靠性带来了巨大改进。

多智能体编排与看板系统 (Kanban)

Hermes 不再仅仅是一个独立的 AI 工具,而是演变为一个持久的自主工作空间,具备多智能体操作环境。

无限看板与订阅

新增的看板功能允许用户创建无限数量的看板项目。通过配置的门控信使 (gateway messenger),用户可以直接在主频道中订阅项目更新。这意味着可以一次性协调多个智能体完成不同任务,并通过看板进行统一管理。

设置步骤

  1. 更新客户端:在终端运行 hermes update 确保 Hermes 为最新版本。
  2. 初始化看板:复制 Hermes 看板初始化命令并粘贴到终端。
  3. 启动 Web UI:复制 Hermes 仪表板命令并运行,启动 Web 界面。
  4. 管理任务:在左侧面板查看插件,即可在看板中管理和组织所有多智能体操作,追踪任务状态(待处理、进行中、已完成等)。

长期目标命令 (/goal)

Hermes 新增了类似 Codeex 和 Claude Code 的 /goal 命令。

  • 自主目标模式:不同于单次提示,/goal 命令启动长时间自主目标模式。
  • 持续循环:智能体将持续进行规划、执行、审查,并在遇到故障时重试。
  • 子任务管理:智能体将自主管理子任务,直到最终目标真正完成。
  • 记忆与移交:该命令管理编排记忆,并在不同智能体之间移交任务,所有状态均通过上述看板进行跟踪。

模型支持:Qwen 2.5

阿里巴巴的 Qwen 2.5 系列模型(特别是 Qwen 2.5 Plus/Coder 等变体,原文提及 Qwen 3.6 可能为口误或特定内部版本引用,此处指代最新强力 Qwen 模型)现已直接在 Nous Portal 中可用,并在有限时间内免费。

  • 性能优势:Qwen 在 Web 开发、长上下文工作流(支持百万级 Token 上下文窗口)以及多模态任务方面表现卓越。
  • 集成优势:Nous Portal 构建在 OpenRouter 之上,提供所有 OpenRouter 模型路由的优势,以及专为 Hermes 优化的独家免费模型、折扣和捆绑工具使用。
  • 访问方式:前往 Nous Research 网站创建账户即可访问免费层级的模型。

其他功能更新

  • 语音克隆:支持使用 XES 自定义语音行作为 TTS 提供商进行语音克隆。
  • 多语言支持:Hermes 可使用多种语言进行交流,并支持 Google Chat 集成。
  • 桌面应用:新增了完整的 WebUI 和桌面应用程序支持,提升了用户体验。

总结

Hermes Agent 的此次更新极大地增强了其作为开源自主智能体的能力。通过后台电脑操控、集成 Light Panda 浏览器、强大的多智能体看板以及长期目标管理,Hermes 正在成为一个能够自我改进、长期运行且高度可控的生产力系统。随着 Windows 和 Linux 支持的即将加入,其适用范围将进一步扩大。


来源:Hermes Agent is evolving FAST… (https://www.youtube.com/watch?v=Gx2joHxUhgg&feature=youtu.be)

相似文章

NousResearch/hermes-agent

GitHub Trending (daily)

Hermes Agent 是由 Nous Research 推出的开源、自我进化 AI 智能体框架,具备闭环学习循环、跨平台部署能力,并兼容数百种大语言模型。它提供终端界面、持久化记忆、自动化调度以及用于扩展 AI 工作流的科研级工具。

@0xJeff: https://x.com/0xJeff/status/2066883577141428563

X AI KOLs Timeline

Hermes Analyst 获得重大更新,包括重新设计的用户界面/用户体验、更简单的代理配置、用于改进研究的嵌套编排器、Hermes Desktop 和 Windows 版本发布,以及与 Stripe 的集成。