gui-agents

标签

Cards List
#gui-agents

Video2GUI:合成大规模交互轨迹以进行通用GUI智能体预训练

arXiv cs.CL · 昨天 缓存

提出了Video2GUI,一个从无标签教学视频中自动提取GUI交互轨迹的框架,构建了包含12M条轨迹、覆盖1500+应用的WildGUI数据集。在该数据上进行预训练,在GUI定位和动作基准测试上提升了5-20%。

0 人收藏 0 人点赞
#gui-agents

WebHarbor - 我们将真实网站“对接”到本地,供网页代理使用![R]

Reddit r/MachineLearning · 2天前

WebHarbor 将 15 个真实网站(Amazon、GitHub、BBC 等)打包为自包含的 Flask+SQLite 应用,置于单个 Docker 镜像中,支持亚秒级重置,专为可重复的网页智能体评估与训练而设计。该项目邀请社区贡献,以扩展到 100 多个网站,并提供合著机会。

0 人收藏 0 人点赞
#gui-agents

ClawGUI:用于训练、评估和部署 GUI Agent 的统一框架

Papers with Code Trending · 2026-04-13 缓存

ClawGUI 是一个开源框架,用于通过强化学习训练、评估和部署 GUI Agent,具备标准化基准测试能力,并支持跨平台部署至 Android、iOS 和 HarmonyOS。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈