标签
一款新工具,使 AI 代理能够通过真实的 Chrome 实例浏览网页,支持实时 DOM 访问、MCP 工具及多标签页控制。
Codex已更新,允许在后台操控Chrome标签页,从而实现无需用户主动监督的自动化网页任务。
OpenAI 推出 Deep Research,这是一个由早期版本 o3 驱动的智能体功能,能够为复杂任务执行多步网络研究。在向 Pro 用户推出前,已实施全面的安全测试和隐私保护。
# 计算机使用代理 来源: [https://openai.com/index/computer-using-agent/](https://openai.com/index/computer-using-agent/) 通过计算机使用代理(Computer-Using Agent)为Operator提供支持,这是AI与数字世界交互的通用接口。今天我们推出了[Operator\(在新窗口中打开\)](https://operator.chatgpt.com/)的研究预览版,这是一个能够在网络上为你执行任务的代理。Operator由计算机使用代理(CUA)驱动,这是一个结合了GPT-4o视觉功能的模型
OpenDevin 是一个开源平台,用于开发能够通过编写代码、使用命令行以及浏览网页来与环境互动的 AI 代理。该平台支持多种代理、沙箱化代码执行,以及 SWE-Bench 等评估基准。
OpenAI 对 GPT-3 进行了微调,使其能够使用基于文本的网络浏览器来搜索、检索和引用源资料,从而更准确地回答开放式问题。该模型在 ELI5 数据集的问题上的表现优于人类演示者 56% 的时间,但在 TruthfulQA 等分布外任务上存在局限性。