@Teknium:今天就来体验我们的「Computer Use」早期预览版(支持任意模型)!集成于最新 Hermes Agent,由 … 驱动

X AI KOLs Following 工具

摘要

Teknium 推出了一项「Computer Use」早期预览功能,该功能内置于 Hermes Agent 中,并由 TryCua 提供动力,允许任何 AI 模型在后台与桌面环境交互并对其进行控制,且不会覆盖用户的直接输入。

今天就尝试一下我们的「Computer Use」早期预览版(支持任意模型)吧!集成于最新的 Hermes Agent,并由 @trycua 提供支持——这向所有模型敞开了大门,而不仅仅是那些处于特殊模式下的前沿模型,让模型能够控制你的实际电脑。最棒的是,它不会接管你的 PC —— 你可以继续工作并保持对键盘、鼠标和屏幕的完全控制权——一切尽在后台运行!
查看原文

相似文章

@VincentLogic: 发现个挺有意思的 AI 助手客户端! Hermes Agent,界面做得挺清爽的中文桌面应用。功能集成得挺全: - 对话、会话管理 - 多模型支持 - 技能、工具集成 - 定时任务、网关配置 从界面看能帮你:搜索网页、设置提醒、总结邮件、…

X AI KOLs Timeline

Hermes Agent 是一款基于 Electron 开发的跨平台 AI 助手桌面客户端,支持多模型切换、技能集成与定时任务等功能,旨在为用户提供统一的 AI 效率工作台。

计算机使用代理

OpenAI Blog

# 计算机使用代理 来源: [https://openai.com/index/computer-using-agent/](https://openai.com/index/computer-using-agent/) 通过计算机使用代理(Computer-Using Agent)为Operator提供支持,这是AI与数字世界交互的通用接口。今天我们推出了[Operator⁠\(在新窗口中打开\)](https://operator.chatgpt.com/)的研究预览版,这是一个能够在网络上为你执行任务的代理。Operator由计算机使用代理(CUA)驱动,这是一个结合了GPT-4o视觉功能的模型

推出 Gemini 2.5 计算机使用模型

Google DeepMind Blog

Google 通过 Gemini API 发布 Gemini 2.5 计算机使用模型,使开发者能够构建可通过点击、输入和滚动与用户界面交互的 AI 代理。该模型在网页和移动控制基准测试中表现优异,延迟更低,现已在 Google AI Studio 和 Vertex AI 中提供预览版。