language-collapse

#language-collapse

AdaMame: 自适应多语言推理的训练方案

arXiv cs.CL ↗ · 2026-06-16 缓存

本文介绍了AdaMame，一种两阶段训练方案（SFT + GRPO），用于在多语言数学推理中自适应地将推理语言与查询语言对齐，在不牺牲准确性的情况下缓解语言崩溃。

0 人收藏 0 人点赞