interaction-trajectories

标签

Cards List
#interaction-trajectories

Video2GUI:合成大规模交互轨迹以进行通用GUI智能体预训练

arXiv cs.CL · 2026-05-15 缓存

提出了Video2GUI,一个从无标签教学视频中自动提取GUI交互轨迹的框架,构建了包含12M条轨迹、覆盖1500+应用的WildGUI数据集。在该数据上进行预训练,在GUI定位和动作基准测试上提升了5-20%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈