icml-workshop

#icml-workshop

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

arXiv cs.LG ↗ · 2026-06-09 Cached

UNIQ introduces a conformal calibration method for offline reinforcement learning that adapts conservatism per-state based on uncertainty, improving over IQL on some D4RL benchmarks while maintaining memory efficiency.

0 favorites 0 likes

icml-workshop

UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning

Submit Feedback