@BitRobotNetwork: 1/ 介绍 HIW-500 (Humanoids-in-the-Wild 500):在真实家庭环境中收集的最大开源人形机器人遥操作数据集……

X AI KOLs Following 论文

摘要

介绍 HIW-500,在真实家庭中收集的最大开源人形机器人遥操作数据集,包含东南亚12个家庭的500多小时和23K+个任务片段。

1/ 介绍 HIW-500 (Humanoids-in-the-Wild 500): 在真实家庭中收集的最大开源人形机器人遥操作数据集 与 @UnitreeRobotics 和 @huggingface 合作,在东南亚12个家庭中构建,涵盖: > 500+ 小时 > 23K+ 个任务片段 > 10+ TB > 10+ 种家务任务 https://t.co/KUfFJm4wno
查看原文
查看缓存全文

缓存时间: 2026/06/24 14:03

1/ 介绍 HIW-500(Humanoids-in-the-Wild 500): 在真实家庭中收集的最大开源人形机器人遥操作数据集

由 @UnitreeRobotics 和 @huggingface 联合构建,覆盖东南亚 12 个家庭,包含:

500+ 小时 23K+ 个 episode 10+ TB 10+ 种家务任务

2/ 人形机器人在运动能力上取得了巨大进步。

但在真实家庭中进行全身移动操作,仍然是机器人领域最大的未解难题之一。

大多数数据集都是在受控环境中收集的。而真实家庭环境杂乱、不可预测,充满各种边缘情况。

要打造能在真实世界中工作的“机器人管家”,我们需要来自真实世界的数据。HIW-500 正是迈向这一方向的一步。

3/ 为构建此数据集,我们使用了以下硬件配置:

Unitree G1 人形机器人 立体头部摄像头 IR 立体腕部摄像头 夹爪

这样设计是为了捕捉日常家居环境中的全身运动与操作。

4/ 每个 episode 包含:

头部摄像头 RGB(480p,30 FPS) 腕部摄像头 RGB + IR(480p,30 FPS) 完整的机器人状态与动作(29 个自由度、IMU、里程计) Episode 与子任务标注

5/ 数据集包含 10+ 种长时程家庭任务,部分 episode 时长超过 8 分钟。

这些长时程任务涵盖导航、物体操作以及需要全身协调的多步骤活动。

6/ 每个任务拥有数千个演示和详细的子任务标注,研究人员可以在多个抽象层面上训练和评估模型。

7/ 这个项目是数月努力的成果,背后有出色的合作伙伴。

任何尝试过遥操作人形机器人的朋友都知道这有多难。而在真实家庭中收集数千个高质量的全身演示,更是另一层级的挑战。

衷心感谢 @UnitreeRobotics 的硬件支持。

也感谢 @huggingface 继我们之前开源大规模城市导航数据集后,再次与我们合作。

8/ 完整 10TB 数据集以 ROSbag + @LeRobotHF 格式提供 ↓

数据集:https://huggingface.co/datasets/BitRobot/In-The-Wild-Humanoid-Dataset… LeRobot:https://huggingface.co/datasets/BitRobot/In-The-Wild-Humanoid-Dataset-LeRobot…

如需研究或商业使用扩展版 HIW-500 数据集 → https://bitrobot-foundation.github.io/humanoids-in-the-wild-500-hours/… 或直接联系我们!

相似文章

HumanNet:将以人为本的视频学习扩展至百万小时规模

Hugging Face Daily Papers

HumanNet 是一个包含百万小时标注视频的大规模以人为本的视频数据集,旨在训练视觉-语言-动作模型。它证明了以第一人称视角拍摄的人类视频可以有效地替代机器人数据,用于具身智能任务。