icml-workshop

标签

Cards List
#icml-workshop

UNIQ:面向离线强化学习的共形校准自适应保守性方法

arXiv cs.LG · 2026-06-09 缓存

UNIQ引入了一种用于离线强化学习的共形校准方法,该方法基于不确定性对每个状态自适应调整保守性,在部分D4RL基准测试上优于IQL,同时保持内存效率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈