worst-dimension-optimization

#worst-dimension-optimization

Improving Multimodal Reasoning via Worst Dimension Optimization

arXiv cs.AI ↗ · 7h ago Cached

This paper introduces Multimodal Multi-Dimensional Scalarization Process Reward Modeling (MMS-PRM), which enforces the worst dimension's robustness in multimodal reasoning to prevent failures like visual hallucinations from being masked by strong text logic.

0 favorites 0 likes

worst-dimension-optimization

Improving Multimodal Reasoning via Worst Dimension Optimization

Submit Feedback