multi-hop-tasks

标签

Cards List
#multi-hop-tasks

GTA: 大规模生成Web智能体的长时域任务

arXiv cs.AI · 2026-05-29 缓存

本文介绍了GTA,一个可扩展的框架,用于自动生成具有可执行轨迹的长时域、多跳Web智能体任务,解决了Web智能体基准测试中缺乏过程级监督的问题。该框架集成了爬取、基于检索的种子生成和自动质量控制,以在多个网站上产生现实的任务。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈