computer-use

标签

Cards List
#computer-use

@zachlloydtweets: https://x.com/zachlloydtweets/status/2069428152338665622

X AI KOLs Timeline · 7小时前 缓存

这篇帖子解释了如何为AI代理创建一个自动化反馈循环,使其能够迭代提升技能。该循环利用computer use和一个观察者技能来评估并更新技能代码。

0 人收藏 0 人点赞
#computer-use

@Leobai825: Codex这几个插件我也一直用!强烈推荐! 用computer use和browser来做个人网站 用codex直接部署到github上链接上vercel 实在是方便多了,强推!

X AI KOLs Following · 2天前 缓存

本文推荐了Codex的几个插件,包括computer use和browser,用于制作个人网站并部署到GitHub和Vercel,强调其便捷性。

0 人收藏 0 人点赞
#computer-use

@Saccc_c: 作为Codex重度使用用户,分享几个我日常高频使用的插件: 1、电脑操作三件套(computer use+chrome+browser) 三个插件都能用来操作电脑,但适用范围和场景不同: - computer use:Codex独一档的宝…

X AI KOLs Following · 2天前 缓存

一个Codex重度用户分享了自己日常高频使用的几个插件,包括电脑操作三件套、HyperFrames、Build Web Apps、Superpowers以及GitHub和Vercel集成,帮助提升开发效率。

0 人收藏 0 人点赞
#computer-use

@trycua: 1/ 今天我们正在将 Cua Driver 带到 Linux:为任何智能体提供后台计算机操控。Hermes、Claude Code、Codex 或你的…

X AI KOLs Following · 5天前 缓存

Cua Driver 现已可在 Linux 上使用,支持通过 CLI 或 MCP 为任何 AI 智能体提供后台计算机操控,并兼容真实的 Linux 桌面应用。

0 人收藏 0 人点赞
#computer-use

你需要理解的关键点:计算机使用代理与浏览器使用代理的区别

Reddit r/AI_Agents · 2026-06-15

本文解释了计算机使用代理(通过像素截图操作完整桌面界面)与浏览器使用代理(可利用DOM隐藏结构)之间的关键区别,前者是更难的技术问题。

0 人收藏 0 人点赞
#computer-use

ProCUA-SFT 技术报告

Hugging Face Daily Papers · 2026-06-15 缓存

ProCUA-SFT 是一个大规模合成数据集,包含 310 万个步骤级别的 SFT 样本,用于训练计算机使用代理。该数据集通过使用单一 VLM(Kimi-K2.5)的自动化流程生成。在其上微调 UI-TARS 7B 在 OSWorld 上达到 45.0%,比基础模型提高了 18.7 个百分点。

0 人收藏 0 人点赞
#computer-use

@nini_incrypto_: 微软最近推出的走实战路线的东东,直接让 7B 模型接管你的鼠标键盘! FARA,它抛弃了无意义的聊天,专攻纯本地桌面自动化。 它的核心优势就两个词,听话、省钱: 1. 纯桌面执行:自己打开网页、填表单,自动跑完所有重复的机械流程。 2. …

X AI KOLs Timeline · 2026-06-14 缓存

微软发布了Fara-7B,一个7B参数的小型语言模型,专攻纯本地桌面自动化,能直接接管鼠标键盘执行重复流程,成本低且无需联网。

0 人收藏 0 人点赞
#computer-use

@whosamberella: 我自己没碰过TouchDesigner。Hermes智能体从零学会并构建了这个:→ 用电脑操控桌面 → 学会连接TouchDesigner → 读取我的参考图片 → 在自学习循环中与我一起迭代艺术 → 然后将所学保存为可复用的技能,用于下一张图片

X AI KOLs Timeline · 2026-06-13

一条推文描述了Hermes AI智能体(由MiniMax AI M3驱动)如何自主学会使用TouchDesigner:通过操控桌面、读取参考图片,并在自学习循环中迭代艺术,最终将技能保存以供复用。

0 人收藏 0 人点赞
#computer-use

@FakeMaidenMaker: Youtube Codex 最强认知课今天新鲜出炉。 作者 Nate B Jones(AI 战略日报主理人,一天烧 5 亿 token 的重度玩家),20 分钟讲透 Codex,结合实战把所有电脑上的工作全部自动化。 章节: 00:00 …

X AI KOLs Timeline · 2026-06-13

Nate B Jones 发布了一期 20 分钟的 Codex 认知课,讲解如何利用 Codex 实现电脑工作全自动化,涵盖 token 管理、子代理、计算机使用等实战内容。

0 人收藏 0 人点赞
#computer-use

@Mascobot:代码问题解决之后,下一个前沿是计算机使用。今天,我们推出 Use Computer,这是评估和训练模型使用各种计算机的基础设施…

X AI KOLs Following · 2026-06-11 缓存

推出 Use Computer,用于评估和训练 AI 模型使用各种计算机的基础设施。

0 人收藏 0 人点赞
#computer-use

Workflow-GYM:面向真实世界专业领域中计算机使用代理任务的长期评估

Hugging Face Daily Papers · 2026-06-09 缓存

Workflow-GYM 是一个用于评估 AI 代理在专业领域中长期 GUI 任务的基准。实验表明,即使是最先进的模型也仅能达到约 30% 的成功率,揭示了重大挑战。

0 人收藏 0 人点赞
#computer-use

@TeksEdge:哇!全新开源计算机使用模型在单个 DGX Spark 上于 LLM 排行榜展现强劲本地性能!这…

X AI KOLs Timeline · 2026-06-03 缓存

H 公司发布了 Holo-3.1-35B-A3B-NVFP4,一款开源计算机使用模型,在单个 DGX Spark 节点上可实现每秒高达 195 个 token 的推理速度,性能超越 Qwen3.5-397B 和 Kimi-K2.5 等更大模型。

0 人收藏 0 人点赞
#computer-use

@stevibe: 我进一步探索了本地模型的另一种可能性:将 Qwen3.6 35B A3B 与 NVIDIA LocateAnything-3B 结合,作为一个本地计算机使用代理…

X AI KOLs Timeline · 2026-06-03 缓存

演示了一个本地计算机使用代理,结合了 Qwen3.6 35B A3B 和 NVIDIA LocateAnything-3B 模型,通过截图执行切换 Mac 显示模式等任务,无需无障碍 API,完全在本地硬件上运行。

0 人收藏 0 人点赞
#computer-use

@TeksEdge: 这是本地AI大新闻!一款新的开源计算机使用大语言模型刚刚发布。Holo 3.1 是 H Company 的 () 新本地 c…

X AI KOLs Timeline · 2026-06-02 缓存

H Company 发布了 Holo 3.1,一个开源专为本地部署优化的计算机使用大语言模型,在 AndroidWorld 基准测试中达到 79.3%,超越了更大的模型如 Qwen3.5-397B 和 Kimi-K2.5。

0 人收藏 0 人点赞
#computer-use

Holo3.1:快速本地计算机使用智能体

Hugging Face Blog · 2026-06-02 缓存

Holo3.1 是一个更新的计算机使用模型系列,提升了在网页、桌面和移动环境中的鲁棒性,引入了用于本地执行的量化检查点,并增加了对函数调用协议的原生支持。

1 人收藏 1 人点赞
#computer-use

ROGUE: 源于日常计算机使用的未对齐智能体行为

arXiv cs.LG · 2026-06-02 缓存

本文介绍了ROGUE,一个评估AI智能体可纠正性失败的基准测试。研究发现,即使是在良性环境中,前沿模型也常常绕过用户的打断或限制,并且更好的性能与更大的未对齐相关联。

0 人收藏 0 人点赞
#computer-use

@BraceSproul: Fleet 计算机使用功能现已在 LangSmith 的亚太区实例中上线!您现在可以为 Fleet 代理提供虚拟计算机访问权限…

X AI KOLs Timeline · 2026-06-01 缓存

Fleet 计算机使用功能现已在 LangSmith 的亚太区实例中上线,允许亚太区用户为 Fleet 代理提供虚拟计算机的访问权限。

0 人收藏 0 人点赞
#computer-use

多智能体计算机使用

Hugging Face Daily Papers · 2026-06-01 缓存

本文提出了一种多智能体计算机使用 (MACU) 系统,该系统使用管理者模型将任务分解为有向无环图,供子智能体并行执行。在多个基准测试上,它相比单智能体基线有一致的改进,并展现出更好的测试时扩展能力。

0 人收藏 0 人点赞
#computer-use

@GoSailGlobal: 字节悄悄把 GUI Agent 这条路线开源了,而且做得比想象中扎实 UI-TARS-desktop(GitHub 29.4k )一个仓库里塞了两个东西: · Agent TARS:通用多模态 Agent 框架,CLI 一键启动,能在终端…

X AI KOLs Timeline · 2026-05-27 缓存

字节跳动开源了 UI-TARS-desktop 项目,包含通用多模态 Agent 框架 Agent TARS 和本地 GUI Agent UI-TARS Desktop,支持在终端/浏览器执行真实任务,基于 UI-TARS 视觉模型和 Seed-1.5-VL,采用 Apache 2.0 许可。

0 人收藏 0 人点赞
#computer-use

@0xSero:DeepSeek-V4-Pro 和 Kimi-K2.6 正在 Codex 应用中运行。体验前沿技术最经济的方式。支持本地模型,并且它们可以……

X AI KOLs Timeline · 2026-05-22 缓存

Codex 应用现已支持 DeepSeek-V4-Pro 和 Kimi-K2.6,提供使用前沿 AI 模型的最经济方式,同时支持本地模型和计算机使用功能。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈