language-collapse

标签

Cards List
#language-collapse

AdaMame: 自适应多语言推理的训练方案

arXiv cs.CL · 2026-06-16 缓存

本文介绍了AdaMame,一种两阶段训练方案(SFT + GRPO),用于在多语言数学推理中自适应地将推理语言与查询语言对齐,在不牺牲准确性的情况下缓解语言崩溃。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈