fine-grained-visual-reasoning

#fine-grained-visual-reasoning

Perceive-to-Reason: Decoupling Perception and Reasoning for Fine-Grained Visual Reasoning

Hugging Face Daily Papers ↗ · yesterday Cached

Introduces Perceive-to-Reason (P2R), a framework that decouples visual perception from reasoning in vision-language models using a two-stage process and a role-aware reinforcement learning strategy, achieving state-of-the-art results on fine-grained visual reasoning benchmarks.

0 favorites 0 likes

#fine-grained-visual-reasoning

V-Zero: Answer-Label-Free On-Policy Distillation with Contrastive Evidence Gating for Fine-Grained Visual Reasoning

Hugging Face Daily Papers ↗ · 2026-06-24 Cached

V-Zero is a novel label-free framework for fine-grained visual reasoning that uses contrastive evidence gating and on-policy distillation to improve performance without annotated answer labels, achieving faster training than traditional methods.

0 favorites 0 likes

fine-grained-visual-reasoning

Perceive-to-Reason: Decoupling Perception and Reasoning for Fine-Grained Visual Reasoning

V-Zero: Answer-Label-Free On-Policy Distillation with Contrastive Evidence Gating for Fine-Grained Visual Reasoning

Submit Feedback