physics-reasoning

#physics-reasoning

Physics-R1: An Audited Olympiad Corpus and Recipe for Visual Physics Reasoning

arXiv cs.CL ↗ · 2026-05-15 Cached

This paper audits multimodal physics evaluation pipelines, revealing issues like train-eval contamination, translation drift, and MCQ saturation. It releases new datasets (PhysCorp-A, PhysR1Corp, PhysOlym-A) and a training recipe (Physics-R1) that significantly improves performance on held-out olympiad problems.

0 favorites 0 likes

#physics-reasoning

SeePhys Pro: Diagnosing Modality Transfer and Blind-Training Effects in Multimodal RLVR for Physics Reasoning

Hugging Face Daily Papers ↗ · 2026-05-10 Cached

The paper introduces SeePhys Pro, a benchmark to diagnose modality transfer issues in multimodal RL for physics reasoning, revealing that models struggle with representation-invariant reasoning and often rely on residual textual cues rather than visual evidence.

0 favorites 0 likes

physics-reasoning

Physics-R1: An Audited Olympiad Corpus and Recipe for Visual Physics Reasoning

SeePhys Pro: Diagnosing Modality Transfer and Blind-Training Effects in Multimodal RLVR for Physics Reasoning

Submit Feedback