RoboEvolve：在有限数据下实现机器人操作的计划器与模拟器协同进化

Hugging Face Daily Papers 2026/05/13 00:00 论文

摘要

RoboEvolve是一个框架，它协同进化VLM规划器和VGM模拟器用于机器人操作，仅用500张无标签种子图像就实现了数据效率以及鲁棒的持续学习。

机器人操作的可扩展性根本上受限于任务对齐的物理交互数据的稀缺性。尽管视觉-语言模型（VLM）和视频生成模型（VGM）有望实现自主数据合成，但它们分别存在语义-空间错位和物理幻觉问题。为弥补这一差距，我们提出RoboEvolve，一种新颖的框架，它将VLM规划器和VGM模拟器耦合到一个相互强化的协同进化循环中。完全基于无标签的种子图像运行，RoboEvolve利用认知启发的双阶段机制：(i) 白天探索通过语义控制的多粒度奖励促进基于物理的行为发现，以及(ii) 夜间巩固挖掘“接近失败”的案例以稳定策略优化。在自主渐进课程引导下，系统自然地从简单原子动作扩展到复杂任务。大量实验证明，RoboEvolve (I) 实现了卓越的有效性，将基础规划器提升30个绝对百分点，平均模拟器成功率提高48%；(II) 表现出极度的数据效率，仅用500张无标签种子图像就超越了完全监督的基线——减少了50倍；以及(III) 展示了鲁棒的持续学习能力，无灾难性遗忘。

查看原文

查看缓存全文

缓存时间: 2026/05/14 04:16

论文页面 - RoboEvolve：基于有限数据的机器人操作规划器与模拟器协同进化

来源：https://huggingface.co/papers/2605.13775

摘要

RoboEvolve 将视觉-语言模型与视频生成模型结合在一个协同进化框架中，以实现可扩展的机器人操作，同时提升数据效率并具备持续学习能力。

机器人操作的可扩展性从根本上受限于与任务对齐的物理交互数据的稀缺性。虽然视觉-语言模型 (VLMs) 和视频生成模型 (VGMs) 在自主数据合成方面具有潜力，但它们分别存在语义-空间错位和物理幻觉的问题。为弥补这一差距，我们提出了 RoboEvolve，这是一个新颖的框架，它将 VLM 规划器与 VGM 模拟器耦合在一个相互强化的协同进化循环中。完全基于无标注的种子图像运行，RoboEvolve 利用了一种受认知启发的双阶段机制：(i) 日间探索阶段，通过语义控制的多粒度奖励实现基于物理的行为发现；(ii) 夜间巩固阶段，挖掘“近似失败”样本以稳定策略优化。在自主渐进式课程的引导下，系统自然地从小规模原子动作扩展到复杂任务。大量实验表明，RoboEvolve (I) 实现了卓越的有效性，将基础规划器的性能提升了 30 个绝对百分点，并使模拟器的成功率平均提升 48%；(II) 展现出极高的数据效率，仅凭 500 个无标注种子图像就超越了完全监督的基线——实现了 50 倍的数据缩减；(III) 在无灾难性遗忘的情况下展示了鲁棒的持续学习能力。

查看 arXiv 页面 (https://arxiv.org/abs/2605.13775)查看 PDF (https://arxiv.org/pdf/2605.13775)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.13775)

在你的 Agent 中获取此论文：

hf papers read 2605.13775

没有最新的 CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型 0

暂无模型链接到本论文

请在你的模型 README.md 中引用 arxiv.org/abs/2605.13775，以将其链接到此页面。

引用该论文的数据集 0

暂无数据集链接到本论文

请在你的数据集 README.md 中引用 arxiv.org/abs/2605.13775，以将其链接到此页面。

引用该论文的 Spaces 0

暂无 Space 链接到本论文

请在你的 Space README.md 中引用 arxiv.org/abs/2605.13775，以将其链接到此页面。

包含该论文的集合 0

暂无包含该论文的集合

请将此论文添加到一个集合 (https://huggingface.co/new-collection) 中，以将其链接到此页面。

RoboEvolve：在有限数据下实现机器人操作的计划器与模拟器协同进化

论文页面 - RoboEvolve：基于有限数据的机器人操作规划器与模拟器协同进化

摘要

引用该论文的模型 0

引用该论文的数据集 0

引用该论文的 Spaces 0

包含该论文的集合 0

相似文章

MLEvolve：自动化机器学习算法发现的自我进化框架

EvoTrainer：面向自主智能体强化学习的LLM策略与训练框架协同进化

CoEvolve：通过智能体-数据互进化训练LLM智能体

EvoMap/evolver

规划复杂视觉任务的更优方法

提交意见反馈