跨语言探索参数化知识
摘要
本文探索了跨语言提示策略,以改进对大语言模型中参数化知识的访问,并在涵盖17种语言的多语言基准测试中展示了知识迁移和事实召回方面的显著提升。
arXiv:2606.24579v1 公告类型:新
摘要:大语言模型中的参数化知识在不同语言中的可访问性并不相同。因此,标准推理技术往往难以揭示本地化的事实,导致跨语言知识迁移和一致性的失败。在这项工作中,我们通过探索跨语言提示策略来研究获取隐藏事实知识的技术。我们确定了直接控制参数化知识检索的四个固有维度,并在涵盖17种类型多样的语言的多语言事实基准上对其进行了评估。我们的结果表明,跨语言探索显著改善了知识迁移和事实召回,代表了比原生语言扩展更高效的计算帕累托前沿。此外,我们观察到跨语言一致性的相应改进,这超出了仅凭准确性提升所能解释的范围。总体而言,我们的工作将多语言提示探索建立为一种高效的推理时策略,用于解锁潜在参数化知识。
查看缓存全文
缓存时间: 2026/06/24 07:47
# 跨语言探索参数化知识 来源: https://arxiv.org/abs/2606.24579 查看 PDF (https://arxiv.org/pdf/2606.24579) > **摘要:** 大型语言模型中的参数化知识在不同语言中的可访问性并不均等。因此,标准推理技术往往难以呈现局部化事实,导致跨语言知识迁移与一致性方面出现失败。在本研究中,我们通过探索跨语言提示策略,探讨了访问隐藏事实知识的技术。我们识别出直接支配参数化知识检索的四个固有跨语言探索维度,并在涵盖17种类型多样语言的多元事实基准上对其进行了评估。结果表明,跨语言探索显著提升了知识迁移与事实召回能力,其计算效率帕累托前沿优于单纯依赖母语扩展的方案。此外,我们观察到跨语言一致性也有相应提升,且这种提升无法仅凭准确率增益来解释。总体而言,我们的工作将多语言提示探索确立为一种高效的推理阶段策略,用于释放潜在的参数化知识。 ## 提交历史 来自: Elisha Diskind [查看邮件](https://arxiv.org/show-email/025d7743/2606.24579) **\[v1\]** 2026年6月23日星期二 13:42:40 UTC (5,475 KB)
相似文章
语言模型中跨语言泛化的体外研究
本文引入了一个使用两种程序生成语言的体外框架,用于研究语言模型中的跨语言泛化,发现分词对可复用子结构的保留能力对于跨语言能力迁移比词汇相似性或数据平衡更为关键。
跨语言共识:通过多语言自一致性对齐多语言文化知识
本文提出一个自监督框架,利用多语言自一致性和自我批评机制在不同语言间迁移文化知识,通过从本地语言表征中揭示潜在文化知识,在BLEnD基准测试的英语查询中平均提升5.03%。
跨语言引导的比喻语言生成
本文探讨了多语言大语言模型中内部表示的跨语言迁移,用于比喻语言生成,表明在一种语言中学习到的激活方向可以有效引导其他语言的生成。
重新审视大语言模型中基于参数的知识编辑:理论极限与实证证据
本文对LLMs中基于参数的知识编辑进行了理论分析,揭示了局部编辑如何导致全局推理崩溃,并提供了检索方法优于参数编辑方法的实证证据。
知识超越语言:弥合多语言机器遗忘评估中的鸿沟
本文提出了两个新指标——知识可分性得分(KSS)和知识持久性得分(KPS)——用于评估大语言模型在多语言机器遗忘中的跨语言信息删除,弥补了以往单语言评估协议的不足。