给 AI 配备真机比另一个浏览器代理更有趣
摘要
OpenGUI 被突出展示为一个新颖的 AI 代理平台,它利用实际的 Android 设备执行任务,相较于传统的基于浏览器的代理,提供了更真实的界面。
最近一直在玩 OpenGUI:[https://opengui.ai](https://opengui.ai) 对我来说,有趣之处不在于“又一个浏览器代理”,而在于给模型一个实际的 Android 设备界面:屏幕、触摸、应用状态以及长时间运行的手机任务。网站在视觉上有点过于花哨,但概念相当具体:使用旧手机作为工作节点,而不是假装所有任务都存在于浏览器标签页中。
相似文章
@QingQ77: 让 AI 自动操控真实 Android 手机,执行社交、调研、内容运营等长时段移动端任务 https://github.com/Core-Mate/OpenGUI… OpenGUI 是个 AI 手机操控系统,AI 直接在你的 Androi…
OpenGUI 是一个开源 AI 手机操控系统,让 AI 自动操控真实 Android 设备执行社交、调研等长时段移动端任务,支持通过飞书、Telegram、Discord 或 REST API 远程派发任务,底层架构分为 Plan Supervisor 和 Executor Graph 两层,支持 Claude、Qwen、豆包等多种模型。
AI 一周要闻:AI 应用大爆发(Anthropic、OpenAI、Google)
OpenAI 全新 Codex 桌面应用把代码生成、浏览器自动化与持久化 Agent 集成进单一 IDE;Anthropic 为 Claude Code 新增并行会话功能;Google 推出桌面应用、Chrome 斜杠命令及一款高表现力 TTS 模型。
别急着换用AI浏览器(除非你看完这个)
像OpenAI的Atlas和Perplexity的Comet这样的AI浏览器,将AI助手直接嵌入浏览过程,具备记忆和自主代理能力,但由于提示注入攻击带来的重大安全风险,它们不适合用于敏感用途。
我给 AI 代理在我的电脑上装上了“眼睛”
作者介绍了 Pupil,这是一款开源工具,使 AI 代理能够视觉检查 PC 用户界面并识别点击目标,而无需依赖截图。
介绍 Operator
OpenAI 发布了 Operator,一款 AI 代理,可以自主使用网络浏览器执行表单填写、在线购物和网络交互等任务。目前作为研究预览版向美国 Pro 用户开放,计划进一步扩展并集成到 ChatGPT 中,由新推出的计算机使用代理(CUA)模型驱动。