tree-based-rl

#tree-based-rl

LEAF: Growing Trees Without Branching for Speech-Aware Large Language Model Post-Training

arXiv cs.LG ↗ · 2026-06-09 Cached

This paper proposes LEAF, a retrospective tree-based reinforcement learning method for speech-aware large language model post-training that improves credit assignment without online branching. LEAF outperforms GRPO on speech question answering and speech translation benchmarks.

0 favorites 0 likes

tree-based-rl

LEAF: Growing Trees Without Branching for Speech-Aware Large Language Model Post-Training

Submit Feedback