out-of-distribution-detection

标签

Cards List
#out-of-distribution-detection

超越惩罚机制:基于扩散模型的离线强化学习分布外检测与选择性正则化

arXiv cs.LG · 昨天 缓存

本文介绍了 DOSER,这是一种利用扩散模型进行分布外(OOD)检测和选择性正则化的框架,旨在离线强化学习中通过区分有益和有害的 OOD 动作来提升在静态数据集上的表现。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈