自动驾驶的前沿之路:KITScenes多模态数据集
摘要
KITScenes Multimodal 是一个高保真度的欧洲自动驾驶数据集,配备同步传感器、完整的3D高精地图,以及用于空间学习和具身AI研究的四个基准测试。
查看缓存全文
缓存时间: 2026/06/05 22:10
论文页面 - 自动驾驶未来之路:KITScenes 多模态数据集
来源:https://huggingface.co/papers/2606.02956
摘要
KITScenes 多模态数据集提供了高保真的欧洲驾驶数据,包含全面的3D地图和多样化的城市环境,用于具身AI研究。
现有的自动驾驶数据集(https://huggingface.co/papers?q=autonomous%20driving%20datasets)推动了重大进展,但在传感器保真度、地图完整性或地理多样性方面仍存在不足。我们推出了 KITScenes Multimodal,这是一个基于高保真传感器(https://huggingface.co/papers?q=high-fidelity%20sensors)和地图构建的欧洲数据集。我们的完全同步传感器套件结合了高分辨率全局快门相机、量程超过400米的长距离激光雷达、4D成像雷达(https://huggingface.co/papers?q=4D%20imaging%20radar)以及冗余 GNSS/INS 定位(https://huggingface.co/papers?q=GNSS%2FINS%20localization)。据我们所知,我们的高清地图(https://huggingface.co/papers?q=HD%20maps)是传感器数据集中最完整的,并通过开源软件上的自动驾驶试验进行了验证。在公开数据集中,我们首次将所有与驾驶相关的交通元素(如交通信号灯)以3D形式映射到重投影精度级别,并具备完整的拓扑连接。我们的数据集录制于街道布局不规则、交通模式混合的城市,通过拓宽可用的地理多样性,补充了现有数据集。我们还引入了四个基准测试,每个都在推进具身AI(https://huggingface.co/papers?q=embodied%20AI)的空间学习(https://huggingface.co/papers?q=spatial%20learning):在线高清地图构建(https://huggingface.co/papers?q=online%20HD%20map%20construction)、长距离深度估计(https://huggingface.co/papers?q=long-range%20depth%20estimation)、新视角合成(https://huggingface.co/papers?q=novel%20view%20synthesis)和端到端驾驶(https://huggingface.co/papers?q=end-to-end%20driving)。项目页面:https://kitscenes.com/
查看 arXiv 页面(https://arxiv.org/abs/2606.02956)查看 PDF(https://arxiv.org/pdf/2606.02956)项目页面(https://kitscenes.com/)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.02956)
在你的智能体中获取这篇论文:
hf papers read 2606.02956
没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型0
尚无模型链接该论文
请在你的模型 README.md 中引用 arxiv.org/abs/2606.02956,以便从此页面链接。
引用该论文的数据集1
KIT-MRT/KITScenes-Multimodal 更新于2天前 • 632 • 11 (https://huggingface.co/datasets/KIT-MRT/KITScenes-Multimodal)
引用该论文的空间0
尚无空间链接该论文
请在你的空间 README.md 中引用 arxiv.org/abs/2606.02956,以便从此页面链接。
包含该论文的收藏0
尚无收藏包含该论文
请将此论文添加到收藏(https://huggingface.co/new-collection)中,以便从此页面链接。
相似文章
面向部分可观测环境下自动驾驶的统一风险地图学习
提出了一种面向部分可观测环境的自动驾驶统一风险地图建模框架,该框架通过时空建模和基于扩散的场景生成,整合了交通流风险和碰撞风险。在Waymo Open Motion数据集上,该方法优于最先进的遮挡感知基线。
ScenePilot: 可控的边界驱动型自动驾驶关键场景生成
ScenePilot 提出了一个可行性引导的、边界驱动的框架,用于为自动驾驶生成安全关键场景,通过约束多目标强化学习来生成物理上有效但会诱发失败的场景。
HERMES++:迈向用于 3D 场景理解与生成的统一驾驶世界模型
本文介绍了 HERMES++,这是一种统一的驾驶世界模型,它利用 BEV 表示、大语言模型(LLM)增强的查询以及联合几何优化,整合了 3D 场景理解和未来几何预测。
用于多相输运和热系统数据驱动建模的开放多模态数据集与开源软件
本文介绍了用于可复现的AI驱动热流体研究的开放多模态数据集和开源软件包,提出了时空维度框架及SeqReg等序列回归工具。
NVIDIA OmniDreams:用于闭环自动驾驶仿真的实时生成式世界模型
NVIDIA推出OmniDreams,这是一个基于Cosmos扩散模型构建的生成式世界模型,用于实时动作条件视频生成,能够在复杂的未见场景中实现自动驾驶策略评估的闭环仿真。