robustness-enhancement

#robustness-enhancement

Robust-U1: Can MLLMs Self-Recover Corrupted Visual Content for Robust Understanding?

Hugging Face Daily Papers ↗ · 2026-06-06 Cached

Robust-U1 is a framework that enables multimodal large language models (MLLMs) to self-recover corrupted visual content using supervised fine-tuning, reinforcement learning with dual rewards, and joint multimodal reasoning, achieving state-of-the-art robustness on corruption benchmarks.

0 favorites 0 likes

robustness-enhancement

Robust-U1: Can MLLMs Self-Recover Corrupted Visual Content for Robust Understanding?

Submit Feedback