跨语言探索参数化知识

arXiv cs.CL 论文

摘要

本文探索了跨语言提示策略,以改进对大语言模型中参数化知识的访问,并在涵盖17种语言的多语言基准测试中展示了知识迁移和事实召回方面的显著提升。

arXiv:2606.24579v1 公告类型:新 摘要:大语言模型中的参数化知识在不同语言中的可访问性并不相同。因此,标准推理技术往往难以揭示本地化的事实,导致跨语言知识迁移和一致性的失败。在这项工作中,我们通过探索跨语言提示策略来研究获取隐藏事实知识的技术。我们确定了直接控制参数化知识检索的四个固有维度,并在涵盖17种类型多样的语言的多语言事实基准上对其进行了评估。我们的结果表明,跨语言探索显著改善了知识迁移和事实召回,代表了比原生语言扩展更高效的计算帕累托前沿。此外,我们观察到跨语言一致性的相应改进,这超出了仅凭准确性提升所能解释的范围。总体而言,我们的工作将多语言提示探索建立为一种高效的推理时策略,用于解锁潜在参数化知识。
查看原文
查看缓存全文

缓存时间: 2026/06/24 07:47

# 跨语言探索参数化知识
来源: https://arxiv.org/abs/2606.24579
查看 PDF (https://arxiv.org/pdf/2606.24579)

> **摘要:** 大型语言模型中的参数化知识在不同语言中的可访问性并不均等。因此,标准推理技术往往难以呈现局部化事实,导致跨语言知识迁移与一致性方面出现失败。在本研究中,我们通过探索跨语言提示策略,探讨了访问隐藏事实知识的技术。我们识别出直接支配参数化知识检索的四个固有跨语言探索维度,并在涵盖17种类型多样语言的多元事实基准上对其进行了评估。结果表明,跨语言探索显著提升了知识迁移与事实召回能力,其计算效率帕累托前沿优于单纯依赖母语扩展的方案。此外,我们观察到跨语言一致性也有相应提升,且这种提升无法仅凭准确率增益来解释。总体而言,我们的工作将多语言提示探索确立为一种高效的推理阶段策略,用于释放潜在的参数化知识。

## 提交历史

来自: Elisha Diskind [查看邮件](https://arxiv.org/show-email/025d7743/2606.24579) **\[v1\]** 2026年6月23日星期二 13:42:40 UTC (5,475 KB)

相似文章

语言模型中跨语言泛化的体外研究

arXiv cs.CL

本文引入了一个使用两种程序生成语言的体外框架,用于研究语言模型中的跨语言泛化,发现分词对可复用子结构的保留能力对于跨语言能力迁移比词汇相似性或数据平衡更为关键。

跨语言引导的比喻语言生成

arXiv cs.CL

本文探讨了多语言大语言模型中内部表示的跨语言迁移,用于比喻语言生成,表明在一种语言中学习到的激活方向可以有效引导其他语言的生成。