denoiser

#denoiser

GDSD: Reinforcement Learning as Guided Denoiser Self-Distillation for Diffusion Language Models

Hugging Face Daily Papers ↗ · 2026-05-28 Cached

GDSD proposes a reinforcement learning method that directly distills denoisers from advantage-guided self-teachers for diffusion language models, avoiding biases from ELBO-based likelihood surrogates. It achieves up to +19.6% accuracy improvements on planning, math, and coding benchmarks over prior state-of-the-art methods.

0 favorites 0 likes

denoiser

GDSD: Reinforcement Learning as Guided Denoiser Self-Distillation for Diffusion Language Models

Submit Feedback