expert-advice

标签

Cards List
#expert-advice

自动驾驶中基于不确定性感知与时间规制的专家建议强化学习

arXiv cs.AI · 3天前 缓存

本文提出了一种面向自动驾驶的不确定性感知强化学习框架,通过自适应不确定性阈值和承诺-冷却策略引导的专家建议,提升了安全性和效率。在CARLA模拟器上的实验表明,相较于IQN基线,成功率提高了5%-7%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈