multi-turn-rl

标签

Cards List
#multi-turn-rl

UI-TARS-2 技术报告:通过多轮强化学习推进图形用户界面代理

Papers with Code Trending · 2025-09-02 缓存

UI-TARS-2 是一款原生以图形用户界面为中心的代理模型,解决了数据可扩展性、多轮强化学习以及环境稳定性等挑战,在图形用户界面基准测试中取得了领先成果(Online-Mind2Web 88.2 分,OSWorld 47.5 分,WindowsAgentArena 50.6 分,AndroidWorld 73.3 分),优于 Claude 和 OpenAI 代理模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈