upper-confidence-bound

标签

Cards List
#upper-confidence-bound

通过绝对扰动实现线性赌博机中的随机探索

arXiv cs.LG · 3天前 缓存

本文提出绝对汤普森采样(ATS),这是对汤普森采样的一种改进,通过使用绝对探索噪声确保期望上的乐观性,在保持计算效率的同时实现了更简单的UCB风格遗憾分析。它达到了与现有TS界相匹配的遗憾,并引入了一种集成变体,该变体收敛于UCB行为。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈