KinDER:面向机器人学习与规划的物理推理基准
摘要
KinDER 是一个全新的开源机器人物理推理基准,采用程序化生成的环境并提供基准模型,旨在评估运动学和动力学约束方面的挑战。
查看缓存全文
缓存时间: 2026/05/08 07:47
论文页面 - KinDER:面向机器人学习与规划的物理推理基准
来源:https://huggingface.co/papers/2604.25788 作者:
,
,
,
,
,
,
,
,
,
,
摘要
KinDER 是一个面向机器人物理推理的基准测试,包含程序化生成的环境和跨越多种学习范式的基线方法,旨在解决运动学和动力学约束方面的挑战。
与物理世界交互的机器人系统(https://huggingface.co/papers?q=Robotic%20systems)必须对其自身具身、环境以及当前任务所施加的运动学和动力学约束(https://huggingface.co/papers?q=dynamic%20constraints)进行推理。我们提出了 KinDER,这是一个针对运动学和动力学具身推理(https://huggingface.co/papers?q=Embodied%20Reasoning)的基准测试,旨在解决机器人学习和规划中出现的物理推理(https://huggingface.co/papers?q=physical%20reasoning)挑战。KinDER 包含 25 个程序化生成的环境、一个兼容 Gymnasium 的 Python 库(内含参数化技能和演示数据),以及一套标准化的评估套件,其中实现了 13 个基线方法,涵盖任务与运动规划(https://huggingface.co/papers?q=motion%20planning)、模仿学习(https://huggingface.co/papers?q=imitation%20learning)、强化学习(https://huggingface.co/papers?q=reinforcement%20learning)以及基于基础模型的方法。这些环境的设计旨在隔离五个核心物理推理(https://huggingface.co/papers?q=physical%20reasoning)挑战:基本空间关系、非抓握式多物体操作、工具使用、组合几何约束以及动力学约束(https://huggingface.co/papers?q=dynamic%20constraints),并使其与感知、语言理解及应用特定复杂性解耦。实证评估显示,现有方法在解决许多环境任务时面临困难,表明当前物理推理(https://huggingface.co/papers?q=physical%20reasoning)方法存在显著差距。此外,我们还在移动操作臂上进行了实机到仿真再到实机(https://huggingface.co/papers?q=real-to-sim-to-real%20experiments)的实验,以评估仿真与现实世界物理交互之间的一致性。KinDER 完全开源,旨在促进不同范式之间的系统比较,从而推动机器人领域的物理推理(https://huggingface.co/papers?q=physical%20reasoning)发展。项目网站和代码:https://prpl-group.com/kinder-site/
查看 arXiv 页面 (https://arxiv.org/abs/2604.25788)查看 PDF (https://arxiv.org/pdf/2604.25788)项目页面 (https://prpl-group.com/kinder-site/)GitHub25 (https://github.com/Princeton-Robot-Planning-and-Learning/kindergarden)添加到收藏夹 (https://huggingface.co/login?next=%2Fpapers%2F2604.25788)
在你的智能体中获取这篇论文:
hf papers read 2604\.25788
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 4
kinder-bench/kinder-openpi-checkpoints 机器人学• 更新于约 12 小时前 (https://huggingface.co/kinder-bench/kinder-openpi-checkpoints)
kinder-bench/kinder-DP-checkpoints 机器人学• 更新于约 12 小时前 (https://huggingface.co/kinder-bench/kinder-DP-checkpoints)
kinder-bench/kinder-DPES-checkpoints 机器人学• 更新于约 12 小时前 (https://huggingface.co/kinder-bench/kinder-DPES-checkpoints)
kinder-bench/kinder-mbrl-checkpoints 机器人学• 更新于约 12 小时前 (https://huggingface.co/kinder-bench/kinder-mbrl-checkpoints)
引用此论文的数据集 1
kinder-bench/kinder-datasets 更新于约 12 小时前 • 39 (https://huggingface.co/datasets/kinder-bench/kinder-datasets)
引用此论文的应用空间 0
没有链接到此论文的应用空间
在应用空间的 README.md 中引用 arxiv.org/abs/2604.25788 即可从此页面进行链接。
包含此论文的合集 0
没有包含此论文的合集
将此论文添加到合集 (https://huggingface.co/new-collection) 即可从此页面进行链接。
相似文章
MiraBench:评估机器人世界模型中的动作条件可靠性
MiraBench是一个分层基准测试,用于评估机器人世界模型中的动作条件可靠性,在12种模型配置下评估物理一致性、动作跟随准确性和乐观偏差。
RoboLab:用于任务通用策略分析的高保真仿真基准
# 论文页面 - RoboLab:用于任务通用策略分析的高保真仿真基准 来源:[https://huggingface.co/papers/2604.09860](https://huggingface.co/papers/2604.09860) ## 摘要 RoboLab 是一个仿真基准框架,通过可扩展的真实任务生成和对策略在受控扰动下行为的系统分析,解决机器人策略评估中的局限。
3DCodeBench:通过代码对智能体过程化3D建模进行基准测试
本文介绍了3DCodeBench——一个用于评估视觉语言模型通过代码进行过程化3D建模的基准测试,以及3DCodeArena——一个基于成对人类偏好的排名平台。
A2RBench:一种自动化的可形式化验证抽象推理基准生成范式
本文介绍了A2RBench,一个用于为LLM生成可形式化验证的抽象推理基准的自动化流水线,它利用循环一致性来确保唯一解,并揭示当前LLM在3D推理任务上显著落后于人类。
Safety Gym
OpenAI 推出 Safety Gym,这是一个新的基准环境和工具包,用于研究受约束的强化学习和安全探索。该平台包含多个机器人和任务,旨在通过成本函数与奖励函数一起量化和衡量安全探索。