@heyrimsha: 我刚刚找到了最接近笔记本电脑“AI 员工”的东西。UI-TARS 让你给电脑下达任务,然后 AI 就……

X AI KOLs Timeline 模型

摘要

UI-TARS 是一个 AI 智能体,能够控制笔记本电脑屏幕来执行点击、打字和浏览等操作,实际上充当了设备本地的 AI 员工。

我刚刚找到了最接近笔记本电脑“AI 员工”的东西。 UI-TARS 让你给电脑下达任务,然后 AI 就帮你控制屏幕。 它可以查看你的应用、点击按钮、打字、浏览、使用本地文件,并像真人一样操作你的桌面。 最棒的一点:100% https://t.co/uerlWmrWtO
查看原文
查看缓存全文

缓存时间: 2026/05/11 00:35

我刚刚找到了最接近“AI 员工”的笔记本电脑工具。

UI-TARS 允许你给电脑下达任务,然后由 AI 自动控制屏幕。

它可以查看你的应用程序、点击按钮、输入文字、浏览网页、使用本地文件,并像真人一样操作你的桌面。

最棒的是:100% https://t.co/uerlWmrWtO

相似文章

bytedance/UI-TARS-desktop

GitHub Trending (daily)

ByteDance 发布了 TARS,这是一个多模态 AI 智能体技术栈,包含 Agent TARS(基于 CLI/Web UI 的通用 AI 智能体,支持 GUI、浏览器和终端任务)和 UI-TARS Desktop(由 UI-TARS 模型驱动的原生桌面应用,用于本地和远程计算机/浏览器自动化)。该技术栈将多模态 LLM 与 MCP 工具相结合,实现类人任务处理能力。

@axiaisacat: 字节跳动开源了一个能直接操控你电脑的 AI 叫 UI-TARS,开源免费,本地运行 你用说话的方式告诉它: 「帮我在 Priceline 订9月1日最早的旧金山到纽约的机票」 「帮我把 VS Code 的自动保存延迟设置成500毫秒」 「…

X AI KOLs Timeline

ByteDance has open-sourced UI-TARS, an AI model capable of directly controlling computer interfaces via mouse and keyboard for tasks like booking flights or configuring software. Available in 2B, 7B, and 72B parameter sizes, it runs locally and offers a free alternative to paid services like Anthropic's Computer Use.

UI-TARS-2 技术报告:通过多轮强化学习推进图形用户界面代理

Papers with Code Trending

UI-TARS-2 是一款原生以图形用户界面为中心的代理模型,解决了数据可扩展性、多轮强化学习以及环境稳定性等挑战,在图形用户界面基准测试中取得了领先成果(Online-Mind2Web 88.2 分,OSWorld 47.5 分,WindowsAgentArena 50.6 分,AndroidWorld 73.3 分),优于 Claude 和 OpenAI 代理模型。