oversensitivity

#oversensitivity

奖励模型可能过于敏感（22分钟阅读）

TLDR AI ↗ · 4天前缓存

本文认为强化学习中的奖励模型往往过于敏感，对同样好的回答给出不同分数，并提出了一个基于Monte Carlo dropout的免训练离散化算法来降低过度敏感性，从而提高策略质量。

0 人收藏 0 人点赞

#oversensitivity

Hugging Face Daily Papers ↗ · 2026-06-19 缓存

本文指出了连续奖励模型在强化学习中的过度敏感问题，即同等质量的回复被赋予不同的分数，并提出了一种使用蒙特卡洛dropout的离散化技术，以减少这种过度敏感，同时保持区分能力，从而得到更好的策略并减少奖励破解。

0 人收藏 0 人点赞