KARLA: 基于知识库增强检索的语言模型

arXiv cs.AI 2026/06/26 04:00 论文

knowledge-augmented retrieval language-models factual-grounding transparency knowledge-base

摘要

KARLA 提出了一种方法，让大型语言模型在生成过程中查询知识库，从而无需重新训练即可更新事实知识，并提高透明度。实验表明，该方法在短文本和长文本生成中均提升了事实依据性。

arXiv:2606.26807v1 公告类型：新摘要：我们提出了一种新方法，允许大型语言模型在生成令牌时自动从知识库中获取事实知识。这意味着：(1)~无需重新训练 LLM 即可更新 LLM 输出中的事实知识，(2)~LLM 输出中的事实可追溯到知识库，以提高透明度和可解释性，(3)~较小的模型可以达到与较大模型相同的事实准确性。我们的核心思想是训练模型生成特殊令牌，以触发对知识库的查询。我们的实验表明，我们的方法在短文本和长文本生成中均改善了事实依据性，并允许通过知识库编辑（而非参数更新）来实现事实修订。

查看原文

查看缓存全文

缓存时间: 2026/06/26 05:17

# KARLA：基于知识库增强检索的语言模型
来源：https://arxiv.org/abs/2606.26807
查看 PDF（https://arxiv.org/pdf/2606.26807）

> **摘要：** 我们提出了一种新方法，使大语言模型（LLM）能够在生成 token 时自动从知识库中获取事实知识。这意味着：（1）LLM 输出中的事实知识可以在无需重新训练 LLM 的情况下进行更新；（2）LLM 输出中的事实可以追溯到知识库，从而实现透明性和可解释性；（3）较小的模型可以达到与较大模型相同的事实准确性。我们的核心思想是训练模型生成特殊 token，这些 token 会触发对知识库的查询。实验表明，我们的方法在短文本和长文本生成中均能改善事实依据，并且可以通过知识库编辑（而非参数更新）使事实修订生效。

## 提交历史

来自：Francois Crespin [查看邮箱](https://arxiv.org/show-email/d807e8f6/2606.26807) [通过 CCSD 代理] **[v1]** 2026年6月25日星期四 09:44:40 UTC（2,572 KB）

KARLA: 基于知识库增强检索的语言模型

相似文章

LLM Wiki v2（16分钟阅读）

增强元认知AI：基于图论的大语言模型富集的知识图谱填充

@AlphaSignalAI: LLM 知识库最近我发现非常有用的东西：使用 LLM 为各种研究兴趣主题构建个人知识库...

@omarsar0：受 @karpathy 的 LLM 知识库想法启发的 LLM Artifacts，我一直在构建一种生成动态产物的有趣方式……

PASTA：一种用于LLM知识更新的释义与自训练方法

提交意见反馈