compositional-generation

#compositional-generation

Catastrophic Compositional Generation: Why Vanilla Diffusion Models Fail to Extrapolate

arXiv cs.LG ↗ · 4d ago Cached

This paper argues that vanilla conditional diffusion models fundamentally fail at compositional generation when the target distribution is out-of-distribution, due to score estimation error, and that inference-time corrections cannot fully compensate.

0 favorites 0 likes

#compositional-generation

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization

Hugging Face Daily Papers ↗ · 2026-05-27 Cached

This paper introduces BiDPO, a framework that enhances text-to-image models for complex compositional prompts through preference-based fine-tuning and region-level guidance, achieving state-of-the-art results on compositional fidelity benchmarks.

0 favorites 0 likes

compositional-generation

Catastrophic Compositional Generation: Why Vanilla Diffusion Models Fail to Extrapolate

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization

Submit Feedback