discriminative-ability

#discriminative-ability

Discretizing Reward Models

Hugging Face Daily Papers ↗ · 2026-06-19 Cached

This paper identifies oversensitivity in continuous reward models for reinforcement learning, where equally good responses receive different scores, and proposes a discretization technique using Monte Carlo dropout to reduce this oversensitivity while maintaining discriminative ability, leading to better policies and less reward hacking.

0 favorites 0 likes

discriminative-ability

Discretizing Reward Models

Submit Feedback