@BitRobotNetwork: 1/ 介绍 HIW-500 (Humanoids-in-the-Wild 500):在真实家庭环境中收集的最大开源人形机器人遥操作数据集……
摘要
介绍 HIW-500,在真实家庭中收集的最大开源人形机器人遥操作数据集,包含东南亚12个家庭的500多小时和23K+个任务片段。
查看缓存全文
缓存时间: 2026/06/24 14:03
1/ 介绍 HIW-500(Humanoids-in-the-Wild 500): 在真实家庭中收集的最大开源人形机器人遥操作数据集
由 @UnitreeRobotics 和 @huggingface 联合构建,覆盖东南亚 12 个家庭,包含:
500+ 小时 23K+ 个 episode 10+ TB 10+ 种家务任务
2/ 人形机器人在运动能力上取得了巨大进步。
但在真实家庭中进行全身移动操作,仍然是机器人领域最大的未解难题之一。
大多数数据集都是在受控环境中收集的。而真实家庭环境杂乱、不可预测,充满各种边缘情况。
要打造能在真实世界中工作的“机器人管家”,我们需要来自真实世界的数据。HIW-500 正是迈向这一方向的一步。
3/ 为构建此数据集,我们使用了以下硬件配置:
Unitree G1 人形机器人 立体头部摄像头 IR 立体腕部摄像头 夹爪
这样设计是为了捕捉日常家居环境中的全身运动与操作。
4/ 每个 episode 包含:
头部摄像头 RGB(480p,30 FPS) 腕部摄像头 RGB + IR(480p,30 FPS) 完整的机器人状态与动作(29 个自由度、IMU、里程计) Episode 与子任务标注
5/ 数据集包含 10+ 种长时程家庭任务,部分 episode 时长超过 8 分钟。
这些长时程任务涵盖导航、物体操作以及需要全身协调的多步骤活动。
6/ 每个任务拥有数千个演示和详细的子任务标注,研究人员可以在多个抽象层面上训练和评估模型。
7/ 这个项目是数月努力的成果,背后有出色的合作伙伴。
任何尝试过遥操作人形机器人的朋友都知道这有多难。而在真实家庭中收集数千个高质量的全身演示,更是另一层级的挑战。
衷心感谢 @UnitreeRobotics 的硬件支持。
也感谢 @huggingface 继我们之前开源大规模城市导航数据集后,再次与我们合作。
8/ 完整 10TB 数据集以 ROSbag + @LeRobotHF 格式提供 ↓
数据集:https://huggingface.co/datasets/BitRobot/In-The-Wild-Humanoid-Dataset… LeRobot:https://huggingface.co/datasets/BitRobot/In-The-Wild-Humanoid-Dataset-LeRobot…
如需研究或商业使用扩展版 HIW-500 数据集 → https://bitrobot-foundation.github.io/humanoids-in-the-wild-500-hours/… 或直接联系我们!
相似文章
HumanNet:将以人为本的视频学习扩展至百万小时规模
HumanNet 是一个包含百万小时标注视频的大规模以人为本的视频数据集,旨在训练视觉-语言-动作模型。它证明了以第一人称视角拍摄的人类视频可以有效地替代机器人数据,用于具身智能任务。
@rohanpaul_ai:中国的人形机器人竞赛已从实验室演示转向实际发货。全球人形机器人出货量在20…
2025年全球人形机器人出货量增长近800%,中国目前拥有140家人形机器人制造商,12个月内推出330款新机型;根据IDC分析,AGIBOT排名第一。
@lukas_m_ziegler: 开源机器人又一次胜利!@huggingface 刚刚发布了一个完全开源的人形机器人,你可以用……
Hugging Face 发布了 LeRobot Humanoid,这是一个开源、低成本(2500美元)的3D打印人形机器人平台,包含硬件、仿真和控制工具,用于机器人学习研究。
HumanScale: 自我中心人类视频在具身预训练中可超越真实机器人数据
本文发现,经过过滤和标注流水线处理的自我中心人类视频,在预训练具身基础模型时可以超越遥操作真实机器人数据,在真实机器人任务上实现了更低的验证损失和更高的成功率。
印度越来越多工人佩戴头戴式摄像头收集视频数据,用于训练人形机器人
印度工人越来越多地使用头戴式摄像头收集视频数据,以训练人形机器人,凸显了人工智能数据收集领域的这一日益增长的趋势。