面向部分可观测环境下自动驾驶的统一风险地图学习
摘要
提出了一种面向部分可观测环境的自动驾驶统一风险地图建模框架,该框架通过时空建模和基于扩散的场景生成,整合了交通流风险和碰撞风险。在Waymo Open Motion数据集上,该方法优于最先进的遮挡感知基线。
查看缓存全文
缓存时间: 2026/05/29 07:01
论文页面 - 部分可观测环境下自动驾驶的统一风险图学习
来源:https://huggingface.co/papers/2605.22189
摘要
一种统一的风险图建模框架,通过时空建模和基于扩散的场景生成,整合交通流风险与碰撞风险,解决了自动驾驶中的遮挡挑战。
遮挡感知预测(https://huggingface.co/papers?q=Occlusion-aware%20prediction)由于未观测区域固有的不确定性,仍是自动驾驶中的关键难题。现有方法要么基于可达状态高估风险,要么在高遮挡不确定性下难以预测准确轨迹。为克服这些局限,我们提出了一种面向部分可观测环境(https://huggingface.co/papers?q=partially%20observable%20environments)的统一风险图建模(https://huggingface.co/papers?q=risk%20map%20modeling)与学习框架。该方法通过时空建模(https://huggingface.co/papers?q=spatiotemporal%20modeling)整合交通流风险与碰撞风险,实现对遮挡引发危险的细粒度评估。针对遮挡交互场景稀缺的问题,我们引入了一个基于扩散的场景生成(https://huggingface.co/papers?q=diffusion-based%20scenario%20generation)框架,可生成真实且具对抗性的场景。我们将统一风险图的建模与学习集成到一个支持部分可观测下风险感知规划(https://huggingface.co/papers?q=risk-aware%20planning)的框架中。在Waymo Open Motion数据集上的实验表明,我们的方法显著优于现有的最优遮挡感知基线,最小碰撞时间提升0.78倍,平均碰撞时间提升1.67倍。所提框架为部分可观测环境(https://huggingface.co/papers?q=partially%20observable%20environments)下的风险感知规划(https://huggingface.co/papers?q=risk-aware%20planning)提供了一种全面且实用的解决方案。
查看arXiv页面(https://arxiv.org/abs/2605.22189)查看PDF(https://arxiv.org/pdf/2605.22189)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2605.22189)
在你的代理中获取此论文:
hf papers read 2605.22189
没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用本论文的模型0
暂无模型链接本论文
在模型README.md中引用 arxiv.org/abs/2605.22189 以在此页面建立链接。
引用本论文的数据集0
暂无数据集链接本论文
在数据集README.md中引用 arxiv.org/abs/2605.22189 以在此页面建立链接。
引用本论文的Space0
暂无Space链接本论文
在Space README.md中引用 arxiv.org/abs/2605.22189 以在此页面建立链接。
包含本论文的收藏集0
暂无收藏集包含本论文
将本论文添加至收藏集(https://huggingface.co/new-collection)以在此页面建立链接。
相似文章
面向行人行为不确定性的安全自动驾驶的多智能体强化学习
本文提出了一种多智能体强化学习框架,该框架同时训练自动驾驶车辆和具有个性驱动乱穿马路行为的行人,与单智能体方法相比,碰撞率降低了30%,并展示了更真实的交互场景。
自动驾驶中基于不确定性感知与时间规制的专家建议强化学习
本文提出了一种面向自动驾驶的不确定性感知强化学习框架,通过自适应不确定性阈值和承诺-冷却策略引导的专家建议,提升了安全性和效率。在CARLA模拟器上的实验表明,相较于IQN基线,成功率提高了5%-7%。
HERMES++:迈向用于 3D 场景理解与生成的统一驾驶世界模型
本文介绍了 HERMES++,这是一种统一的驾驶世界模型,它利用 BEV 表示、大语言模型(LLM)增强的查询以及联合几何优化,整合了 3D 场景理解和未来几何预测。
ScenePilot: 可控的边界驱动型自动驾驶关键场景生成
ScenePilot 提出了一个可行性引导的、边界驱动的框架,用于为自动驾驶生成安全关键场景,通过约束多目标强化学习来生成物理上有效但会诱发失败的场景。
RAD-2:在生成器-判别器框架中扩展强化学习
RAD-2 提出了一个用于自动驾驶的统一生成器-判别器框架,将基于扩散的轨迹生成与强化学习优化的重排序相结合,与基于扩散的规划器相比,碰撞率降低了56%。该方法引入了 Temporally Consistent Group Relative Policy Optimization 和 BEV-Warp 仿真环境等技术,以实现高效的大规模训练。