RoboLab：用于任务通用策略分析的高保真仿真基准

Hugging Face Daily Papers 2026/04/14 00:00 论文

robotics simulation benchmarking foundation-models generalization policy-evaluation llm

摘要

# 论文页面 - RoboLab：用于任务通用策略分析的高保真仿真基准来源：[https://huggingface.co/papers/2604.09860](https://huggingface.co/papers/2604.09860) ## 摘要 RoboLab 是一个仿真基准框架，通过可扩展的真实任务生成和对策略在受控扰动下行为的系统分析，解决机器人策略评估中的局限。

对通用机器人的追求催生了令人印象深刻的基础模型，但基于仿真的基准测试却因性能快速饱和且缺乏真正的泛化测试而成为瓶颈。现有基准常在训练与评估之间存在显著的域重叠，使得成功率被过度简化，并掩盖了对鲁棒性的洞察。我们推出 RoboLab，一个旨在应对这些挑战的仿真基准框架。具体而言，该框架旨在回答两个问题：（1）通过在仿真中分析行为，我们能在多大程度上理解真实世界策略的性能；（2）在受控扰动下，哪些外部因素最强烈地影响该行为。首先，RoboLab 支持人类编写与 LLM 辅助的场景与任务生成，以机器人和策略无关的方式在物理真实且照片级真实的仿真环境中进行。基于此，我们提出 RoboLab-120 基准，包含 120 项任务，按视觉、程序、关系三项能力轴划分，并覆盖三个难度等级。其次，我们引入对真实世界策略的系统分析，量化其性能及对受控扰动的行为敏感度，表明高保真仿真可作为分析性能及其对外部因素依赖的代理。使用 RoboLab 评估揭示了当前最先进模型的显著性能差距。通过提供细粒度指标与可扩展工具集，RoboLab 为评估任务通用机器人策略的真正泛化能力提供了可扩展框架。

查看原文

查看缓存全文

缓存时间: 2026/04/21 07:21

论文页面 - RoboLab：面向任务通才策略分析的高保真仿真基准

来源：https://huggingface.co/papers/2604.09860

摘要

RoboLab 是一个仿真基准框架，通过可扩展、逼真的任务生成和在受控扰动下对策略行为的系统分析，解决机器人策略评估的局限。

通用机器人研究已取得令人瞩目的基础模型（https://huggingface.co/papers?q=foundation%20models），但基于仿真的基准测试却成为瓶颈：性能迅速饱和，且缺乏真正的泛化测试。现有基准常在训练与评估之间存在显著域重叠，导致成功率虚高，并掩盖对鲁棒性的洞察。我们推出 RoboLab，一个专为解决这些挑战而设计的仿真基准（https://huggingface.co/papers?q=simulation%20benchmarking）框架。具体而言，该框架旨在回答两个问题：(1) 通过在仿真中分析行为，我们能在多大程度上理解真实世界策略的性能；(2) 在受控扰动（https://huggingface.co/papers?q=controlled%20perturbations）下，哪些外部因素最强烈地影响该行为。首先，RoboLab 支持人工编写和 LLM 辅助生成场景与任务，方式与机器人和策略无关，并在物理真实且照片级逼真的仿真（https://huggingface.co/papers?q=photorealistic%20simulation）中进行。基于此，我们提出 RoboLab-120 基准，包含 120 项任务，按视觉、程序、关系三项能力轴分类，并跨越三个难度等级。其次，我们引入对真实世界策略的系统分析，量化其性能及其行为对受控扰动（https://huggingface.co/papers?q=controlled%20perturbations）的敏感度，表明高保真仿真可作为分析性能及其对外部因素依赖的代理。RoboLab 的评估揭示了当前顶尖模型的显著性能差距。通过提供细粒度指标和可扩展工具集，RoboLab 为评估任务通才机器人策略（https://huggingface.co/papers?q=task-generalist%20robotic%20policies）的真正泛化能力提供了可扩展框架。

查看 arXiv 页面（https://arxiv.org/abs/2604.09860）
查看 PDF（https://arxiv.org/pdf/2604.09860）
项目主页（https://research.nvidia.com/labs/srl/projects/robolab/）
GitHub77（https://github.com/NVLabs/RoboLab）
添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2604.09860）

引用本文的模型 0

暂无模型链接本文

在模型 README.md 中引用 arxiv.org/abs/2604.09860 即可在此页面显示链接。

引用本文的数据集 0

暂无数据集链接本文

在数据集 README.md 中引用 arxiv.org/abs/2604.09860 即可在此页面显示链接。

引用本文的 Spaces 0

暂无 Space 链接本文

在 Space README.md 中引用 arxiv.org/abs/2604.09860 即可在此页面显示链接。

RoboLab：用于任务通用策略分析的高保真仿真基准

论文页面 - RoboLab：面向任务通才策略分析的高保真仿真基准

摘要

引用本文的模型 0

引用本文的数据集 0

引用本文的 Spaces 0

包含本文的合集 1

相似文章

RoboMemArena：一个全面且具挑战性的机器人记忆基准测试

Agentick：用于通用序贯决策智能体的统一基准

SkillLearnBench：面向真实任务代理技能生成的持续学习方法基准

RoboEvolve：在有限数据下实现机器人操作的计划器与模拟器协同进化

Roboschool

提交意见反馈