BitTide
首页
Trending
论文
模型
工具
新闻
产品
事件
时间轴
搜索
订阅
English
登录
out-of-distribution-detection
标签
Cards
List
#out-of-distribution-detection
超越惩罚机制:基于扩散模型的离线强化学习分布外检测与选择性正则化
arXiv cs.LG
↗
· 昨天
缓存
本文介绍了 DOSER,这是一种利用扩散模型进行分布外(OOD)检测和选择性正则化的框架,旨在离线强化学习中通过区分有益和有害的 OOD 动作来提升在静态数据集上的表现。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交