margin-adversarial

#margin-adversarial

MARS: Margin-Adversarial Risk-controlled Stopping for Parallel LLM Test-time Scaling

arXiv cs.AI ↗ · 6d ago Cached

This paper introduces MARS, a stopping rule for parallel LLM test-time scaling that probes partial traces to stop early without sacrificing accuracy, saving 25–47% of tokens across reasoning models on competition math benchmarks.

0 favorites 0 likes

margin-adversarial

MARS: Margin-Adversarial Risk-controlled Stopping for Parallel LLM Test-time Scaling

Submit Feedback