轨迹中的Hide-and-Seek:发现VLA运行时监控的故障信号

Hugging Face Daily Papers 论文

摘要

Hide-and-Seek是一个通过对比学习定位故障指示动作来检测VLA模型中机器人执行故障的框架,无需步骤级标注,实现了最先进的多任务故障检测性能。

视觉-语言-动作(VLA)模型使机器人能够遵循自然语言指令并泛化到多样化的任务,但在实际部署中仍容易受到执行故障的影响,从而损害可靠性。因此,在执行过程中检测此类故障对于具身系统的稳健部署至关重要。现有的故障检测方法要么依赖昂贵的动作重采样或外部模型,要么替代方案将轨迹级标签均匀传播到每个时间步,掩盖了局部故障信号。在本文中,我们提出了Hide-and-Seek,一个将VLA故障检测视为粗粒度监督学习问题的框架。通过结合轨迹间和轨迹内的对比目标,Hide-and-Seek 定位故障指示动作,并仅从轨迹级监督中诱导出具有时间结构的故障信号,无需任何步骤级标注。我们在LIBERO、VLABench和一个真实机器人平台上,对三种代表性VLA策略——OpenVLA、π_0和π_{0.5}——评估了Hide-and-Seek。我们的方法在保形预测下实现了最先进的多任务故障检测性能,具有实用的准确性与及时性权衡,并且对已见和未见任务都具有良好的泛化能力。
查看原文
查看缓存全文

缓存时间: 2026/06/01 03:18

论文页面 - 轨迹中的捉迷藏:为VLA运行时监控发现故障信号

来源:https://huggingface.co/papers/2605.30834

摘要

Hide-and-Seek框架通过对比学习从轨迹级监督中定位指示故障的动作,无需步级标注即可检测视觉-语言-动作模型中的机器人执行故障。

视觉-语言-动作(VLA)模型使机器人能够遵循自然语言指令并在多样化任务中泛化,但在实际部署中仍易受执行故障影响,从而损害可靠性。因此,在执行过程中检测此类故障对于具身系统的稳健部署至关重要。现有的故障检测方法要么依赖昂贵的动作重采样或外部模型,要么将轨迹级标签均匀传播到每个时间步,从而模糊了局部化的故障信号。本文提出Hide-and-Seek框架,将VLA故障检测形式化为粗监督学习问题。通过结合轨迹间和轨迹内对比目标,Hide-and-Seek仅利用轨迹级监督即可定位指示故障的动作,并诱导出具有时间结构的故障信号,无需任何步级标注。我们在LIBERO、VLABench和真实机器人平台上,针对三种代表性VLA策略(OpenVLA、π₀和π₀.₅)评估了Hide-and-Seek。我们的方法在共形预测下实现了实际准确率-及时性权衡,达到了最先进的多任务故障检测性能,并能良好泛化到已见和未见任务。

查看arXiv页面 (https://arxiv.org/abs/2605.30834)查看PDF (https://arxiv.org/pdf/2605.30834)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.30834)

在你的智能体中获取这篇论文:

hf papers read 2605.30834

没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有模型链接此论文

在模型README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

引用此论文的数据集0

没有数据集链接此论文

在数据集README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

引用此论文的Space空间0

没有Space空间链接此论文

在Space README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

包含此论文的合集0

没有合集包含此论文

将这篇论文添加到合集 (https://huggingface.co/new-collection)中即可从此页面链接。

相似文章

Axol

Product Hunt

Axol 是一款旨在自动化物理工作的机器人,为自动化提供强大的解决方案。