我构建了 agent-browser,但用于操作系统自动化。
摘要
作者介绍了 agent-ctrl,这是一个基于 Rust 的开源 CLI 工具,允许 AI 代理通过辅助功能树与原生应用程序 UI 进行交互,从而实现操作系统自动化。
大家好,r/AI_Agents 的朋友们!我之前使用 agent-browser 来驱动我的代理工作流,效果非常好。当我希望将计算机使用扩展到操作系统本身时,我发现找不到足够好的开源工具,于是决定自己构建一个。**agent-ctrl 是什么?** agent-ctrl 是一个专为 AI 代理设计的操作系统自动化 CLI,使用 Rust 编写以确保速度。**它是如何工作的?** agent-ctrl 将原生应用程序 UI 转换为代理可读的格式,然后让你或你的代理对 UI 进行操作。它将来自任何操作系统的辅助功能树展平并解析为一种统一的 schema,从而支持跨操作系统的代理。目前它支持 Windows,我目前正在开发 MacOS 和 Linux 的支持。我正在寻找愿意为 Linux 部分做出贡献的人,因为我自己不使用 Linux。
相似文章
“代理需要浏览器”问题——我开源了自己的解决方案
Otto (MIT) 是一个开源浏览器扩展,它通过 CLI 或代理将真实标签页转化为可控节点,解决了“代理需要浏览器”的问题,无需无头农场或昂贵的云服务。
难觅客户,遂决定将我的业务免费开放给所有人使用并在此基础上构建
作者将其基于Rust的浏览器自动化工具开源,该工具包含基础设施和部署功能,原本是一项业务,现免费用于AI代理开发。
Open Browser Use
Open Browser Use 是一个面向本地AI代理的开源浏览器自动化工具。
@MingruiZhang: 对@browser_use 的新Terminal Agent有一个问题,我的上下文窗口用了122% https://github.com/browser-use/term…
Browser Use Terminal 是一个用于浏览器代理的 Rust TUI,允许用户从终端自动化浏览器任务,它配备了一个新的LLM harness,比Browser Harness便宜2倍且快2倍。
我给了你的代理访问 Firefox 的权限——认识一下 Firefox CLI
一个新的命令行工具 Firefox CLI,允许 AI 代理控制真实的 Firefox 浏览器会话,提供了相当于 Agent Browser 的 Firefox 版本,并改进了功能,如永久扩展安装和独立的代理窗口。