region-aware

#region-aware

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization

Hugging Face Daily Papers ↗ · 2026-05-27 Cached

This paper introduces BiDPO, a framework that enhances text-to-image models for complex compositional prompts through preference-based fine-tuning and region-level guidance, achieving state-of-the-art results on compositional fidelity benchmarks.

0 favorites 0 likes

region-aware

Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization

Submit Feedback