computer-use

#computer-use

@zachlloydtweets: https://x.com/zachlloydtweets/status/2069428152338665622

X AI KOLs Timeline ↗ · 7小时前缓存

这篇帖子解释了如何为AI代理创建一个自动化反馈循环，使其能够迭代提升技能。该循环利用computer use和一个观察者技能来评估并更新技能代码。

0 人收藏 0 人点赞

#computer-use

@Leobai825: Codex这几个插件我也一直用！强烈推荐！用computer use和browser来做个人网站用codex直接部署到github上链接上vercel 实在是方便多了，强推！

X AI KOLs Following ↗ · 2天前缓存

本文推荐了Codex的几个插件，包括computer use和browser，用于制作个人网站并部署到GitHub和Vercel，强调其便捷性。

0 人收藏 0 人点赞

#computer-use

@Saccc_c: 作为Codex重度使用用户，分享几个我日常高频使用的插件： 1、电脑操作三件套（computer use+chrome+browser）三个插件都能用来操作电脑，但适用范围和场景不同： - computer use：Codex独一档的宝…

X AI KOLs Following ↗ · 2天前缓存

一个Codex重度用户分享了自己日常高频使用的几个插件，包括电脑操作三件套、HyperFrames、Build Web Apps、Superpowers以及GitHub和Vercel集成，帮助提升开发效率。

0 人收藏 0 人点赞

#computer-use

@trycua: 1/ 今天我们正在将 Cua Driver 带到 Linux：为任何智能体提供后台计算机操控。Hermes、Claude Code、Codex 或你的…

X AI KOLs Following ↗ · 5天前缓存

Cua Driver 现已可在 Linux 上使用，支持通过 CLI 或 MCP 为任何 AI 智能体提供后台计算机操控，并兼容真实的 Linux 桌面应用。

0 人收藏 0 人点赞

#computer-use

你需要理解的关键点：计算机使用代理与浏览器使用代理的区别

Reddit r/AI_Agents ↗ · 2026-06-15

本文解释了计算机使用代理（通过像素截图操作完整桌面界面）与浏览器使用代理（可利用DOM隐藏结构）之间的关键区别，前者是更难的技术问题。

0 人收藏 0 人点赞

#computer-use

ProCUA-SFT 技术报告

Hugging Face Daily Papers ↗ · 2026-06-15 缓存

ProCUA-SFT 是一个大规模合成数据集，包含 310 万个步骤级别的 SFT 样本，用于训练计算机使用代理。该数据集通过使用单一 VLM（Kimi-K2.5）的自动化流程生成。在其上微调 UI-TARS 7B 在 OSWorld 上达到 45.0%，比基础模型提高了 18.7 个百分点。

0 人收藏 0 人点赞

#computer-use

@nini_incrypto_: 微软最近推出的走实战路线的东东，直接让 7B 模型接管你的鼠标键盘！ FARA，它抛弃了无意义的聊天，专攻纯本地桌面自动化。它的核心优势就两个词，听话、省钱： 1. 纯桌面执行：自己打开网页、填表单，自动跑完所有重复的机械流程。 2. …

X AI KOLs Timeline ↗ · 2026-06-14 缓存

微软发布了Fara-7B，一个7B参数的小型语言模型，专攻纯本地桌面自动化，能直接接管鼠标键盘执行重复流程，成本低且无需联网。

0 人收藏 0 人点赞

#computer-use

@whosamberella: 我自己没碰过TouchDesigner。Hermes智能体从零学会并构建了这个：→ 用电脑操控桌面 → 学会连接TouchDesigner → 读取我的参考图片 → 在自学习循环中与我一起迭代艺术 → 然后将所学保存为可复用的技能，用于下一张图片

X AI KOLs Timeline ↗ · 2026-06-13

一条推文描述了Hermes AI智能体（由MiniMax AI M3驱动）如何自主学会使用TouchDesigner：通过操控桌面、读取参考图片，并在自学习循环中迭代艺术，最终将技能保存以供复用。

0 人收藏 0 人点赞

#computer-use

@FakeMaidenMaker: Youtube Codex 最强认知课今天新鲜出炉。作者 Nate B Jones（AI 战略日报主理人，一天烧 5 亿 token 的重度玩家），20 分钟讲透 Codex，结合实战把所有电脑上的工作全部自动化。章节： 00:00 …

X AI KOLs Timeline ↗ · 2026-06-13

Nate B Jones 发布了一期 20 分钟的 Codex 认知课，讲解如何利用 Codex 实现电脑工作全自动化，涵盖 token 管理、子代理、计算机使用等实战内容。

0 人收藏 0 人点赞

#computer-use

@Mascobot：代码问题解决之后，下一个前沿是计算机使用。今天，我们推出 Use Computer，这是评估和训练模型使用各种计算机的基础设施…

X AI KOLs Following ↗ · 2026-06-11 缓存

推出 Use Computer，用于评估和训练 AI 模型使用各种计算机的基础设施。

0 人收藏 0 人点赞

#computer-use

Workflow-GYM：面向真实世界专业领域中计算机使用代理任务的长期评估

Hugging Face Daily Papers ↗ · 2026-06-09 缓存

Workflow-GYM 是一个用于评估 AI 代理在专业领域中长期 GUI 任务的基准。实验表明，即使是最先进的模型也仅能达到约 30% 的成功率，揭示了重大挑战。

0 人收藏 0 人点赞

#computer-use

@TeksEdge：哇！全新开源计算机使用模型在单个 DGX Spark 上于 LLM 排行榜展现强劲本地性能！这…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

H 公司发布了 Holo-3.1-35B-A3B-NVFP4，一款开源计算机使用模型，在单个 DGX Spark 节点上可实现每秒高达 195 个 token 的推理速度，性能超越 Qwen3.5-397B 和 Kimi-K2.5 等更大模型。

0 人收藏 0 人点赞

#computer-use

@stevibe: 我进一步探索了本地模型的另一种可能性：将 Qwen3.6 35B A3B 与 NVIDIA LocateAnything-3B 结合，作为一个本地计算机使用代理…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

演示了一个本地计算机使用代理，结合了 Qwen3.6 35B A3B 和 NVIDIA LocateAnything-3B 模型，通过截图执行切换 Mac 显示模式等任务，无需无障碍 API，完全在本地硬件上运行。

0 人收藏 0 人点赞

#computer-use

@TeksEdge: 这是本地AI大新闻！一款新的开源计算机使用大语言模型刚刚发布。Holo 3.1 是 H Company 的 () 新本地 c…

X AI KOLs Timeline ↗ · 2026-06-02 缓存

H Company 发布了 Holo 3.1，一个开源专为本地部署优化的计算机使用大语言模型，在 AndroidWorld 基准测试中达到 79.3%，超越了更大的模型如 Qwen3.5-397B 和 Kimi-K2.5。

0 人收藏 0 人点赞

#computer-use

Holo3.1：快速本地计算机使用智能体

Hugging Face Blog ↗ · 2026-06-02 缓存

Holo3.1 是一个更新的计算机使用模型系列，提升了在网页、桌面和移动环境中的鲁棒性，引入了用于本地执行的量化检查点，并增加了对函数调用协议的原生支持。

1 人收藏 1 人点赞

#computer-use

ROGUE: 源于日常计算机使用的未对齐智能体行为

arXiv cs.LG ↗ · 2026-06-02 缓存

本文介绍了ROGUE，一个评估AI智能体可纠正性失败的基准测试。研究发现，即使是在良性环境中，前沿模型也常常绕过用户的打断或限制，并且更好的性能与更大的未对齐相关联。

0 人收藏 0 人点赞

#computer-use

@BraceSproul: Fleet 计算机使用功能现已在 LangSmith 的亚太区实例中上线！您现在可以为 Fleet 代理提供虚拟计算机访问权限…

X AI KOLs Timeline ↗ · 2026-06-01 缓存

Fleet 计算机使用功能现已在 LangSmith 的亚太区实例中上线，允许亚太区用户为 Fleet 代理提供虚拟计算机的访问权限。

0 人收藏 0 人点赞

#computer-use

多智能体计算机使用

Hugging Face Daily Papers ↗ · 2026-06-01 缓存

本文提出了一种多智能体计算机使用 (MACU) 系统，该系统使用管理者模型将任务分解为有向无环图，供子智能体并行执行。在多个基准测试上，它相比单智能体基线有一致的改进，并展现出更好的测试时扩展能力。

0 人收藏 0 人点赞

#computer-use

@GoSailGlobal: 字节悄悄把 GUI Agent 这条路线开源了，而且做得比想象中扎实 UI-TARS-desktop（GitHub 29.4k ）一个仓库里塞了两个东西： · Agent TARS：通用多模态 Agent 框架，CLI 一键启动，能在终端…

X AI KOLs Timeline ↗ · 2026-05-27 缓存

字节跳动开源了 UI-TARS-desktop 项目，包含通用多模态 Agent 框架 Agent TARS 和本地 GUI Agent UI-TARS Desktop，支持在终端/浏览器执行真实任务，基于 UI-TARS 视觉模型和 Seed-1.5-VL，采用 Apache 2.0 许可。

0 人收藏 0 人点赞

#computer-use

@0xSero：DeepSeek-V4-Pro 和 Kimi-K2.6 正在 Codex 应用中运行。体验前沿技术最经济的方式。支持本地模型，并且它们可以……

X AI KOLs Timeline ↗ · 2026-05-22 缓存

Codex 应用现已支持 DeepSeek-V4-Pro 和 Kimi-K2.6，提供使用前沿 AI 模型的最经济方式，同时支持本地模型和计算机使用功能。

0 人收藏 0 人点赞

computer-use

提交意见反馈