state-verifiers

标签

Cards List
#state-verifiers

OpenComputer:面向计算机使用智能体的可验证软件世界

Hugging Face Daily Papers · 2026-05-19 缓存

OpenComputer 提出了一种框架,用于为计算机使用智能体创建可验证的软件环境,集成了状态验证器、自改进验证层、任务合成以及评估系统,覆盖33个桌面应用程序。实验表明,其验证器与人类判断的一致性优于LLM作为判断者,且前沿智能体在端到端完成方面仍面临困难。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈