KARLA: 基于知识库增强检索的语言模型
摘要
KARLA 提出了一种方法,让大型语言模型在生成过程中查询知识库,从而无需重新训练即可更新事实知识,并提高透明度。实验表明,该方法在短文本和长文本生成中均提升了事实依据性。
arXiv:2606.26807v1 公告类型:新
摘要:我们提出了一种新方法,允许大型语言模型在生成令牌时自动从知识库中获取事实知识。这意味着:(1)~无需重新训练 LLM 即可更新 LLM 输出中的事实知识,(2)~LLM 输出中的事实可追溯到知识库,以提高透明度和可解释性,(3)~较小的模型可以达到与较大模型相同的事实准确性。我们的核心思想是训练模型生成特殊令牌,以触发对知识库的查询。我们的实验表明,我们的方法在短文本和长文本生成中均改善了事实依据性,并允许通过知识库编辑(而非参数更新)来实现事实修订。
查看缓存全文
缓存时间: 2026/06/26 05:17
# KARLA:基于知识库增强检索的语言模型 来源:https://arxiv.org/abs/2606.26807 查看 PDF(https://arxiv.org/pdf/2606.26807) > **摘要:** 我们提出了一种新方法,使大语言模型(LLM)能够在生成 token 时自动从知识库中获取事实知识。这意味着:(1)LLM 输出中的事实知识可以在无需重新训练 LLM 的情况下进行更新;(2)LLM 输出中的事实可以追溯到知识库,从而实现透明性和可解释性;(3)较小的模型可以达到与较大模型相同的事实准确性。我们的核心思想是训练模型生成特殊 token,这些 token 会触发对知识库的查询。实验表明,我们的方法在短文本和长文本生成中均能改善事实依据,并且可以通过知识库编辑(而非参数更新)使事实修订生效。 ## 提交历史 来自:Francois Crespin [查看邮箱](https://arxiv.org/show-email/d807e8f6/2606.26807) [通过 CCSD 代理] **[v1]** 2026年6月25日星期四 09:44:40 UTC(2,572 KB)
相似文章
LLM Wiki v2(16分钟阅读)
本文介绍了一种利用LLM构建个人知识库的模式,为在大语言模型辅助下进行知识管理提供了结构化方法。
增强元认知AI:基于图论的大语言模型富集的知识图谱填充
MetaKGEnrich是一个全自动流水线,使用图指标检测大语言模型应用中的知识缺口,检索网络证据,并在三个基准数据集上将答案质量提升80%-87%。
@AlphaSignalAI: LLM 知识库 最近我发现非常有用的东西:使用 LLM 为各种研究兴趣主题构建个人知识库...
Google 的开放知识格式(OKF)提出了一种可移植的组织知识标准,帮助 AI 代理检索正确的上下文,解决了数据目录、维基和代码之间的碎片化问题。
@omarsar0:受 @karpathy 的 LLM 知识库想法启发的 LLM Artifacts,我一直在构建一种生成动态产物的有趣方式……
受 @karpathy 的 LLM 知识库想法启发,我一直在构建 LLM Artifacts:一种有趣的方式,可以从这些知识库中生成动态产物,旨在发现并揭示有意义且更深层的洞察。LLM 知识库对人类来说很难直接理解消化,正如我
PASTA:一种用于LLM知识更新的释义与自训练方法
PASTA是一种新颖的LLM知识更新框架,结合数据增强、问答生成和自学习DPO技术,整合新闻文章中的事实信息,在保持通用能力的同时,将准确率从0.02提升至0.82。