轨迹中的Hide-and-Seek：发现VLA运行时监控的故障信号

Hugging Face Daily Papers 2026/05/29 00:00 论文

摘要

Hide-and-Seek是一个通过对比学习定位故障指示动作来检测VLA模型中机器人执行故障的框架，无需步骤级标注，实现了最先进的多任务故障检测性能。

视觉-语言-动作（VLA）模型使机器人能够遵循自然语言指令并泛化到多样化的任务，但在实际部署中仍容易受到执行故障的影响，从而损害可靠性。因此，在执行过程中检测此类故障对于具身系统的稳健部署至关重要。现有的故障检测方法要么依赖昂贵的动作重采样或外部模型，要么替代方案将轨迹级标签均匀传播到每个时间步，掩盖了局部故障信号。在本文中，我们提出了Hide-and-Seek，一个将VLA故障检测视为粗粒度监督学习问题的框架。通过结合轨迹间和轨迹内的对比目标，Hide-and-Seek 定位故障指示动作，并仅从轨迹级监督中诱导出具有时间结构的故障信号，无需任何步骤级标注。我们在LIBERO、VLABench和一个真实机器人平台上，对三种代表性VLA策略——OpenVLA、π_0和π_{0.5}——评估了Hide-and-Seek。我们的方法在保形预测下实现了最先进的多任务故障检测性能，具有实用的准确性与及时性权衡，并且对已见和未见任务都具有良好的泛化能力。

查看原文

查看缓存全文

缓存时间: 2026/06/01 03:18

论文页面 - 轨迹中的捉迷藏：为VLA运行时监控发现故障信号

来源：https://huggingface.co/papers/2605.30834

摘要

Hide-and-Seek框架通过对比学习从轨迹级监督中定位指示故障的动作，无需步级标注即可检测视觉-语言-动作模型中的机器人执行故障。

视觉-语言-动作（VLA）模型使机器人能够遵循自然语言指令并在多样化任务中泛化，但在实际部署中仍易受执行故障影响，从而损害可靠性。因此，在执行过程中检测此类故障对于具身系统的稳健部署至关重要。现有的故障检测方法要么依赖昂贵的动作重采样或外部模型，要么将轨迹级标签均匀传播到每个时间步，从而模糊了局部化的故障信号。本文提出Hide-and-Seek框架，将VLA故障检测形式化为粗监督学习问题。通过结合轨迹间和轨迹内对比目标，Hide-and-Seek仅利用轨迹级监督即可定位指示故障的动作，并诱导出具有时间结构的故障信号，无需任何步级标注。我们在LIBERO、VLABench和真实机器人平台上，针对三种代表性VLA策略（OpenVLA、π₀和π₀.₅）评估了Hide-and-Seek。我们的方法在共形预测下实现了实际准确率-及时性权衡，达到了最先进的多任务故障检测性能，并能良好泛化到已见和未见任务。

查看arXiv页面 (https://arxiv.org/abs/2605.30834)查看PDF (https://arxiv.org/pdf/2605.30834)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.30834)

在你的智能体中获取这篇论文：

hf papers read 2605.30834

没有最新的CLI？curl -LsSf https://hf.co/cli/install.sh | bash

引用此论文的模型0

没有模型链接此论文

在模型README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

引用此论文的数据集0

没有数据集链接此论文

在数据集README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

引用此论文的Space空间0

没有Space空间链接此论文

在Space README.md中引用arxiv.org/abs/2605.30834即可从此页面链接。

包含此论文的合集0

没有合集包含此论文

将这篇论文添加到合集 (https://huggingface.co/new-collection)中即可从此页面链接。

轨迹中的Hide-and-Seek：发现VLA运行时监控的故障信号

论文页面 - 轨迹中的捉迷藏：为VLA运行时监控发现故障信号

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的Space空间0

包含此论文的合集0

相似文章

Figure AI的人形机器人产量在五月创下新高

Qualia 入选 Google DeepMind 机器人项目。

机器人所达到的敏捷程度越来越令人惊叹

Axol

我问大家如何处理智能体记忆。以下是回复中的模式，以及无人真正解决的一个问题。

提交意见反馈