uniform-diffusion

#uniform-diffusion

Sumi: Open Uniform Diffusion Language Model from Scratch

Hugging Face Daily Papers ↗ · 2026-06-17 Cached

Sumi is a 7B uniform diffusion language model pretrained from scratch on 1.5T tokens, achieving competitive performance on knowledge and reasoning tasks while being fully open-source with released weights and training recipe.

0 favorites 0 likes

#uniform-diffusion

Uniform Diffusion Models Revisited: Leave-One-Out Denoiser and Absorbing State Reformulation

Hugging Face Daily Papers ↗ · 2026-05-21 Cached

Revisits uniform diffusion models, identifying a mismatch between the plug-in ELBO and cross-entropy denoising objective, and proposes leave-one-out parameterizations along with an absorbing-state reformulation that improves generation without additional training.

0 favorites 0 likes

uniform-diffusion

Sumi: Open Uniform Diffusion Language Model from Scratch

Uniform Diffusion Models Revisited: Leave-One-Out Denoiser and Absorbing State Reformulation

Submit Feedback