multilingual-reasoning

#multilingual-reasoning

通过可操控模型合并增强多语言推理

arXiv cs.CL ↗ · 2026-06-18 缓存

本文提出ST-Merge，一种可操控的模型合并框架，利用门控交叉注意力机制自适应地调节多语言模型和推理模型的贡献，在涵盖21种语言的多语言推理基准测试中优于固定合并方法。

0 人收藏 0 人点赞

#multilingual-reasoning

arXiv cs.CL ↗ · 2026-05-27 缓存

本文重新审视了LLM中的多语言推理差距，发现在可比较的监督条件下，该差距比先前报告的要小。本文引入了Layer Swap，它将来自英语推理专家的中间层权重转移到母语专家，几乎消除了这一差距，同时保留了母语链式思维。

0 人收藏 0 人点赞

#multilingual-reasoning

arXiv cs.CL ↗ · 2026-04-21 缓存

研究人员推出了 x1，这是一类推理模型家族，能够针对每个具体实例自适应地选择最优语言进行推理，证实了在多语言及文化相关任务中，语言选择会对推理质量产生影响。

0 人收藏 0 人点赞

#multilingual-reasoning

arXiv cs.CL ↗ · 2026-04-20 缓存

本文研究了大规模推理模型在11种语言上的多语言潜在推理能力，发现虽然存在潜在推理能力，但分布不均——在资源丰富的语言中较强，在低资源语言中较弱。研究发现，尽管表面存在差异，但内部推理机制在很大程度上与英语中心的路径保持一致。

0 人收藏 0 人点赞