trycua/cua

GitHub Trending (daily) 工具

摘要

trycua/cua 是一个开源工具包和 Python 库,用于构建、基准测试和部署计算机操作代理,具备 macOS 后台自动化功能和跨平台、代理就绪的沙箱。

面向计算机操作代理的开源基础设施。提供沙箱、SDK 和基准测试,用于训练和评估能够控制完整桌面环境(macOS、Linux、Windows)的 AI 代理。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/13 12:12

构建、评估和部署使用计算机的智能体

相似文章

ToolCUA:迈向计算机使用代理的 GUI-工具路径编排优化

Hugging Face Daily Papers

ToolCUA 是一个全新的代理框架,通过分阶段训练和强化学习,优化计算机使用代理的 GUI-工具路径选择。它通过在 GUI 操作和高级工具调用之间进行有效交替,在 OSWorld-MCP 上达到了最先进的性能。

计算机使用代理

OpenAI Blog

# 计算机使用代理 来源: [https://openai.com/index/computer-using-agent/](https://openai.com/index/computer-using-agent/) 通过计算机使用代理(Computer-Using Agent)为Operator提供支持,这是AI与数字世界交互的通用接口。今天我们推出了[Operator⁠\(在新窗口中打开\)](https://operator.chatgpt.com/)的研究预览版,这是一个能够在网络上为你执行任务的代理。Operator由计算机使用代理(CUA)驱动,这是一个结合了GPT-4o视觉功能的模型

bytedance/UI-TARS-desktop

GitHub Trending (daily)

ByteDance 发布了 TARS,这是一个多模态 AI 智能体技术栈,包含 Agent TARS(基于 CLI/Web UI 的通用 AI 智能体,支持 GUI、浏览器和终端任务)和 UI-TARS Desktop(由 UI-TARS 模型驱动的原生桌面应用,用于本地和远程计算机/浏览器自动化)。该技术栈将多模态 LLM 与 MCP 工具相结合,实现类人任务处理能力。