task-generation

#task-generation

OpenComputer：面向计算机使用智能体的可验证软件世界

Hugging Face Daily Papers ↗ · 2026-05-19 缓存

OpenComputer 提出了一种框架，用于为计算机使用智能体创建可验证的软件环境，集成了状态验证器、自改进验证层、任务合成以及评估系统，覆盖33个桌面应用程序。实验表明，其验证器与人类判断的一致性优于LLM作为判断者，且前沿智能体在端到端完成方面仍面临困难。

0 人收藏 0 人点赞