Codex 即将能够通过 Computer Use 控制其他桌面设备(2分钟阅读)

TLDR AI 产品

摘要

OpenAI 正在为 Codex 开发一项功能,使其能够通过 Computer Use 控制 macOS 应用程序,即使在笔记本电脑锁定或休眠时也能操作,并远程控制运行 Codex 应用的其他桌面设备,从而扩展其远程控制能力。

OpenAI 正在开发一项功能,使其编码代理能够通过 Computer Use 操作 macOS 应用程序,即使在笔记本电脑锁定或休眠时也能进行。目前,Computer Use 需要解锁且处于唤醒状态的会话才能查看屏幕、移动光标和打字。解除此限制后,用户无需回到计算机前登录即可直接指挥代理。该功能何时发布尚不清楚。
查看原文
查看缓存全文

缓存时间: 2026/05/19 00:20

# Codex 现在可以通过 Computer Use 控制其他桌面设备 来源:https://www.testingcatalog.com/openai-will-let-codex-control-other-desktop-devices-via-computer-use/ OpenAI 似乎正在悄悄扩展其 Codex 远程控制系统的覆盖范围,开发一项新能力,让编码代理(coding agent)能够通过 Computer Use 操作 macOS 应用程序,即便笔记本电脑处于锁定或休眠状态。这项工作是作为远程控制功能(https://www.testingcatalog.com/openai-brings-codex-to-chatgpt-mobile-app-for-ios-and-android/)的后续推出的,该功能于 5 月 14 日在 ChatGPT 移动应用中上线,允许 iPhone 和 Android 用户查看输出、批准命令、切换模型,并向运行 Codex 桌面应用的 Mac 派遣新任务。 Codex 正在开发的新功能解决了一个核心痛点,那正是该工作流程中最为别扭的环节。**关键障碍在于 Computer Use 本身**,它需要一个解锁且唤醒的会话才能看到屏幕、移动光标以及在应用中输入文字。解除这一限制意味着,用户只需通过手机即可指示代理打开桌面应用、测试 GUI 构建、运行模拟器或访问数据源,而无需亲自走到电脑前先登录解锁。 这一功能还将缩小与 Anthropic 的差距。Anthropic 早在二月份就为其 Claude Code 推出了手机到机器的控制功能,但一旦 Mac 锁定后同样会受到限制。 苹果的应对态度是悬而未决的问题。绕过锁屏意味着设备处于空闲、不可触碰的状态,这与 macOS 的安全默认设置相悖。任何让屏幕驱动代理在锁定会话中保持活跃的做法,很可能都会引起库比蒂诺方面的注意。发布时间尚未透露,但这项功能应被视为同一远程控制故事的第二个节点,而非独立发布。 此外,OpenAI(https://www.testingcatalog.com/tag/chatgpt/)正在探索连接并控制其他运行 Codex 应用的桌面设备的可能性。例如,你可以将其安装在 Mac Mini 上,然后从主设备直接操作它。根据仍在开发中的 UI 组件,用户将能够远程连接并操作多台设备。

相似文章

Computer use in Codex

YouTube AI Channels

OpenAI demonstrates the 'Computer Use' feature in Codex, allowing the AI to directly interact with local GUI applications on macOS using an accessibility framework and the fast Spark model for non-blocking, high-speed automation.

Windows Computer Use and mobile access for Codex

YouTube AI Channels

OpenAI's Codex for Windows now supports computer control and mobile access, allowing users to remotely operate applications and monitor tasks via the ChatGPT mobile app.

几乎无所不能的 Codex

YouTube AI Channels

OpenAI 的 Codex 现已支持 Mac 应用控制、更多工具集成、图像生成、用户偏好记忆,并能处理持续性的重复任务。

Codex 几乎适用于一切

OpenAI Blog

OpenAI 发布了 Codex 的重大更新,使其能够通过光标控制操作计算机、生成图像、通过记忆管理长期任务,并深度集成开发者工作流程,如 SSH 和 PR 审查。