@Teknium:今天就来体验我们的「Computer Use」早期预览版(支持任意模型)!集成于最新 Hermes Agent,由 … 驱动
摘要
Teknium 推出了一项「Computer Use」早期预览功能,该功能内置于 Hermes Agent 中,并由 TryCua 提供动力,允许任何 AI 模型在后台与桌面环境交互并对其进行控制,且不会覆盖用户的直接输入。
相似文章
@NousResearch:配合任何模型实现计算机操作 Hermes Agent × @trycua
NousResearch 宣布,其 Hermes 模型现在可以结合 trycua 框架用于计算机操作任务。
@intheworldofai: Hermes Agent 正在快速发展。就在过去一周内,Nous Research 增加了:- 完整的 WebUI/桌面应用 - 后台计算…
Nous Research 发布了开源 Hermes Agent 的重要更新,新增了原生 macOS 后台电脑使用功能、通过看板进行多智能体编排,以及 Lightpanda 浏览器集成。
@VincentLogic: 发现个挺有意思的 AI 助手客户端! Hermes Agent,界面做得挺清爽的中文桌面应用。功能集成得挺全: - 对话、会话管理 - 多模型支持 - 技能、工具集成 - 定时任务、网关配置 从界面看能帮你:搜索网页、设置提醒、总结邮件、…
Hermes Agent 是一款基于 Electron 开发的跨平台 AI 助手桌面客户端,支持多模型切换、技能集成与定时任务等功能,旨在为用户提供统一的 AI 效率工作台。
计算机使用代理
# 计算机使用代理 来源: [https://openai.com/index/computer-using-agent/](https://openai.com/index/computer-using-agent/) 通过计算机使用代理(Computer-Using Agent)为Operator提供支持,这是AI与数字世界交互的通用接口。今天我们推出了[Operator\(在新窗口中打开\)](https://operator.chatgpt.com/)的研究预览版,这是一个能够在网络上为你执行任务的代理。Operator由计算机使用代理(CUA)驱动,这是一个结合了GPT-4o视觉功能的模型
推出 Gemini 2.5 计算机使用模型
Google 通过 Gemini API 发布 Gemini 2.5 计算机使用模型,使开发者能够构建可通过点击、输入和滚动与用户界面交互的 AI 代理。该模型在网页和移动控制基准测试中表现优异,延迟更低,现已在 Google AI Studio 和 Vertex AI 中提供预览版。