多跳知识图谱问答的本体引导证据路径推理

arXiv cs.AI 2026/06/29 04:00 论文

摘要

提出 OPI，一种面向多跳知识图谱问答的本体引导框架，利用以关系为中心的本体图进行双向检索和迭代精炼，在多个基准上取得了最先进的结果。

arXiv:2606.28076v1 Announce Type: new Abstract: 知识图谱问答（KGQA）旨在通过对结构化事实进行推理来回答自然语言问题。现有的多跳KGQA方法主要依赖于以主题为中心的扩展，这面临两个关键挑战：搜索空间随着噪声混合类型路径的增多而迅速增长，并且检索到的路径可能无法满足复杂问题的语义约束。为了解决这些挑战，我们提出了 OPI，一种用于多跳KGQA的本体引导证据路径推理框架。OPI 引入了一个以关系为中心的本体图，以捕获关系的头尾类型约束，为答案侧约束提供了一个紧凑的接口。基于该本体图，OPI 首先通过将预测的答案类型映射到兼容的最后一跳关系，并结合主题侧前缀扩展与答案侧最后一跳匹配，引入了一种双向检索机制，从而抑制了噪声混合类型扩展。OPI 进一步采用迭代精炼策略，在问题上下文中重新评估检索到的路径和候选答案，过滤掉类型兼容但与问题无关的证据，从而实现更可靠的答案预测。在 WebQSP、CWQ 和 MetaQA 上的实验表明，OPI 显著减少了搜索空间，在 WebQSP 上 Hit@1/F1 提高了 4.6/5.0 个百分点，在 CWQ 上提高了 8.9/3.3 个百分点，超过了此前最强结果，并且仅使用检索模块就在 MetaQA 上达到了接近饱和的 Hit@1。

查看原文

查看缓存全文

缓存时间: 2026/06/29 05:28

# 本体引导的多跳知识图谱问答证据路径推理 来源：https://arxiv.org/html/2606.28076 ，Meihan Wu（彭城实验室，中国深圳，wumh@pcl\.ac\.cn）（https://arxiv.org/html/2606.28076v1/mailto:[email protected]），Cundi Fang（国防科技大学，中国长沙，fangcundi@nudt\.edu\.cn）（https://arxiv.org/html/2606.28076v1/mailto:[email protected]），Jie Peng（国防科技大学，中国长沙，pengjie@nudt\.edu\.cn）（https://arxiv.org/html/2606.28076v1/mailto:[email protected]），以及Xiaodong Wang（国防科技大学，中国长沙，xdwang@nudt\.edu\.cn）（https://arxiv.org/html/2606.28076v1/mailto:[email protected]）

###### 摘要。知识图谱问答（KGQA）旨在通过对结构化事实进行推理来回答自然语言问题。现有的多跳KGQA方法主要依赖于以主题实体为中心的扩展，但这面临两个关键挑战：搜索空间随着嘈杂的混合类型路径而迅速增长，且检索到的路径可能无法满足复杂问题的语义约束。为了解决这些挑战，我们提出OPI，一个用于多跳KGQA的本体引导证据路径推理框架。OPI引入了一个以关系为中心的本体图，用于捕获关系的主语-宾语类型约束，从而为答案侧约束提供紧凑的接口。基于此本体图，OPI首先通过将预测的答案类型映射到兼容的最后一跳关系，结合主题侧前缀扩展与答案侧最后一跳匹配，引入了一种双向检索机制，从而抑制了嘈杂的混合类型扩展。OPI进一步采用迭代优化策略，在问题上下文中重新评估检索到的路径和候选答案，过滤类型兼容但与问题无关的证据，以实现更可靠的答案预测。在WebQSP、CWQ和MetaQA上的实验表明，OPI显著缩小了搜索空间，在WebQSP上相比最强先前结果将Hit@1/F1提高了4.6/5.0个点，在CWQ上提高了8.9/3.3个点，并在MetaQA上仅通过检索模块就实现了接近饱和的Hit@1。PVLDB引用格式：PVLDB, 14(1): XXX-XXX, 2020. doi:XX.XX/XXX.XX (https://doi.org/XX.XX/XXX.XX)††本文采用Creative Commons BY-NC-ND 4.0国际许可协议进行许可。请访问https://creativecommons.org/licenses/by-nc-nd/4.0/ 查看该许可协议的副本。对于超出该许可协议范围的任何使用，需通过电子邮件[email protected] (https://arxiv.org/html/2606.28076v1/mailto:[email protected]) 获得许可。版权归作者/著者所有。出版权授予VLDB Endowment。VLDB Endowment会议论文集，第14卷，第1期，ISSN 2150-8097。doi:XX.XX/XXX.XX (https://doi.org/XX.XX/XXX.XX)

## 1. 引言

知识图谱问答（KGQA）旨在通过推理知识图谱中的实体和关系来回答自然语言问题，并已应用于医疗保健（Frisoniet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib38)）、农业（Yanget al.,2024 (https://arxiv.org/html/2606.28076#bib.bib46)）和多媒体（Leeet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib47)）等领域。受大型语言模型快速发展的推动，近期研究越来越多地将LLM与KG相结合，以支持问题理解、推理规划和基于图的答案生成（Panet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib45)）。这些方法探索了多种策略，包括迭代图探索、关系路径规划和图约束解码，并在KG上的多跳推理方面取得了进展（Liuet al.,2025b (https://arxiv.org/html/2606.28076#bib.bib14); Wenet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib40); Sunet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib10); Luoet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib11),2025 (https://arxiv.org/html/2606.28076#bib.bib15); Tanet al.,2025 (https://arxiv.org/html/2606.28076#bib.bib39); Mavromatis and Karypis,2025 (https://arxiv.org/html/2606.28076#bib.bib13)）。然而，在大规模KG上，复杂的多跳KGQA仍然具有挑战性，因为规模增大、异构性和结构复杂性会引入巨大的搜索空间和模糊的推理证据（Dong,2023 (https://arxiv.org/html/2606.28076#bib.bib44); Geet al.,2021 (https://arxiv.org/html/2606.28076#bib.bib43); Rabbaniet al.,2023 (https://arxiv.org/html/2606.28076#bib.bib42)）。

多跳KGQA的一种常见范式是检索以主题实体为根的证据路径或子图，并从中推导出答案。为了提高检索效率，许多方法通过局部子图构建、迭代图探索和路径剪枝来控制扩展空间（Wenet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib40); Sunet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib10); Tanet al.,2025 (https://arxiv.org/html/2606.28076#bib.bib39)）。为了提高推理质量，近期方法进一步引入了语义信号，如关系路径规划、图结构化提示和基于LLM的证据推理（Liuet al.,2025b (https://arxiv.org/html/2606.28076#bib.bib14); Luoet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib11),2025 (https://arxiv.org/html/2606.28076#bib.bib15); Mavromatis and Karypis,2025 (https://arxiv.org/html/2606.28076#bib.bib13)）。尽管取得了这些进展，大多数检索过程仍然主要由以主题实体为中心的扩展驱动：它们从主题实体开始，逐步探索相邻的实体和关系。因此，检索常常产生大量结构上可达但与预期答案类型不一致的路径，同时也引入无法满足问题复杂语义约束的虚假候选路径。这种以主题实体为中心的检索范式在多跳KGQA中面临两个挑战，如图1 (https://arxiv.org/html/2606.28076#S1.F1) 所示。

第一个是**路径爆炸**：从主题实体进行无约束的前向扩展会产生大量以异构类型为终点的候选路径，其中绝大多数与预期答案类型完全无关。如图1 (https://arxiv.org/html/2606.28076#S1.F1) 上半部分所示，从同一主题实体出发的路径可能分支到国家、人物、奖项、俱乐部、语言和其他混合类型的端点。第二个是**语义错位**：即使候选路径到达与答案类型兼容的实体，它们仍可能违反问题的隐含约束，从而偏离预期的推理语义。如图1 (https://arxiv.org/html/2606.28076#S1.F1) 下半部分所示，多条路径可能导向合理的语言实体，但只有同时捕获了出生国约束和官方语言约束的路径才提供了正确的推理证据。因此，一个有效的多跳KGQA框架需要既能缓解候选路径的爆炸，又能识别满足问题复杂语义约束的推理链。

请参见图注图1. 多跳KGQA中两个主要挑战的示意图。上半部分显示以主题实体为中心的扩展产生了许多混合类型的候选路径，而下半部分显示即使与答案类型兼容的路径也可能仍然违反问题隐含的语义约束。

为了解决这些挑战，我们提出OPI，一个用于多跳KGQA的**本体引导证据路径推理**框架。OPI没有依赖产生嘈杂、混合类型路径的无约束以主题实体为中心的扩展，而是引入了一个以关系为中心的本体图作为证据路径推理的结构基础。该图将知识图谱抽象为一个类型级表示，捕获关系如何连接主语和宾语实体类型，为答案侧约束提供了一个紧凑的接口。在此紧凑接口的驱动下，OPI用解决这两个挑战的两阶段推理范式取代了无约束的以主题实体为中心的检索。它首先利用双向检索机制来施加答案侧约束并提前剪枝爆炸性的搜索空间。然后，它应用迭代优化策略来过滤虚假证据并改善与问题的语义对齐。具体来说，OPI利用**双向检索机制**来获得一组与答案类型兼容的证据路径。给定一个问题，OPI预测隐含的答案类型并将其映射到一小部分与答案类型兼容的最后一跳关系。然后，它将主题侧前缀扩展与答案侧最后一跳匹配相结合，使得检索不再仅仅由无约束的以主题实体为中心的扩展驱动。这种双向检索机制有效抑制了混合类型路径的增长并缓解了结构上的路径爆炸。检索之后，OPI应用**迭代答案优化策略**，在问题上下文中重新评估检索到的路径和候选答案。生成器从当前路径和答案上下文中产生一个答案假设，而优化器则评估该假设以及检索到的证据，并返回结构化反馈。该反馈更新了聚焦的路径上下文和候选答案上下文，使OPI能够过滤类型兼容但与问题无关的证据，并生成更可靠的最终答案。

我们的主要贡献总结如下：
- 我们引入了一个以关系为中心的本体图，它捕获了关系如何连接主语和宾语实体类型，并为答案侧约束路径检索提供了结构基础。
- 我们提出了一种本体引导的双向检索机制，它将主题侧前缀扩展与答案侧最后一跳匹配相结合，以减少嘈杂的混合类型扩展并缓解路径爆炸。
- 我们设计了一种迭代答案优化策略，该策略在问题上下文中共同重新评估检索到的路径和候选答案，以过滤类型兼容但与问题无关的证据。
- 我们在WebQSP、CWQ和MetaQA上进行了广泛实验，证明了OPI及其关键组件在不同KGQA基准上的有效性。

## 2. 预备知识

在本节中，我们通过定义知识图谱、其类型级抽象以及答案预测目标，来形式化本文中考虑的KGQA任务。

### 2.1. 知识图谱与本图

**知识图谱。** 知识图谱表示为 \(\mathcal{G}=(\mathcal{E},\mathcal{R},\mathcal{T})\)，其中：
- \(\mathcal{E}\) 是实体集合；
- \(\mathcal{R}\) 是关系集合；
- \(\mathcal{T}\subseteq\mathcal{E}\times\mathcal{R}\times\mathcal{E}\) 是事实三元组集合。每个事实三元组 \((e_h,r,e_t)\in\mathcal{T}\) 表示主语实体 \(e_h\) 通过关系 \(r\) 连接到宾语实体 \(e_t\)。

**本体图。** 本体图通过关系签名提供了知识图谱的类型级抽象。记为 \(\mathcal{O}=(\mathcal{C},\mathcal{R},\mathcal{S})\)，其中：
- \(\mathcal{C}\) 是与实体关联的语义类型集合；
- \(\mathcal{R}\) 是与知识图谱共享的关系集合；
- \(\mathcal{S}\subseteq\mathcal{C}\times\mathcal{R}\times\mathcal{C}\) 是类型级关系签名集合。每个关系签名 \((c_h,r,c_t)\in\mathcal{S}\) 指定了在本体级别，关系 \(r\) 可以连接类型为 \(c_h\) 的主语实体到类型为 \(c_t\) 的宾语实体。知识图谱存储具体的实体级事实，而本体图通过这些关系签名捕获类型级兼容性。图2 (https://arxiv.org/html/2606.28076#S2.F2) 展示了知识图谱中的实体级三元组如何被抽象为本体图中的类型级关系签名。

请参见图注图2. 知识图谱及其本体图的示例。本体图将实体级三元组抽象为类型级关系签名。

### 2.2. 知识图谱问答

给定一个自然语言问题 \(q\)，我们假设问题中提到的一个主题实体 \(e_q\in\mathcal{E}\) 已按照标准KGQA设置被识别（Jianget al.,2023c (https://arxiv.org/html/2606.28076#bib.bib4); Luoet al.,2024 (https://arxiv.org/html/2606.28076#bib.bib11)）。以 \(e_q\) 为根的**证据路径**是一系列连接的事实三元组：
\[ p = (e_0 \xrightarrow{r_1} e_1 \xrightarrow{r_2} \cdots \xrightarrow{r_l} e_l), \]
其中 \(e_0 = e_q\) 且对于每个 \(1 \leq i \leq l\)，有 \((e_{i-1}, r_i, e_i) \in \mathcal{T}\)。证据路径的终端实体 \(e_l\) 被视为基于知识图谱的候选答案。对于每个问题，真实答案集记为 \(\mathcal{Y}^* \subseteq \mathcal{E}\)。任务是学习一个函数：
\[ f_\theta(q, e_q, \mathcal{G}, \mathcal{O}) \rightarrow \hat{y}, \]
其中 \(\hat{y} \in \mathcal{E}\) 表示最终预测的答案。我们假设每个正确答案 \(y \in \mathcal{Y}^*\) 都可以通过 \(\mathcal{G}\) 中至少一条有界长度的证据路径从主题实体到达。因此，目标是产生一个答案预测 \(\hat{y}\)，该预测既可从主题实体通过图到达，又在语义上与问题表达的约束一致。

## 3. 方法

### 3.1. 整体架构

OPI由三个紧密连接的模块组成：本体图构建、本体引导的双向检索以及迭代答案优化。它首先将原始知识图谱抽象为一个以关系为中心的本体图，其中每个关系由一个类型级关系签名表示。基于该本体图，OPI预测问题隐含的答案类型并将其映射到一组与答案类型兼容的最后一跳关系，从而实现结合主题侧前缀扩展与答案侧最后一跳匹配的双向检索。然后，OPI通过生成器-优化器循环对检索到的证据和候选答案进行优化，其中结构化反馈迭代地更新路径上下文和答案上下文。图3 (https://arxiv.org/html/2606.28076#S3.F3) 总结了OPI的主要推理流程。

请参见图注图3. OPI的总体推理流程。左侧展示了本体引导的双向检索，其检索宾语类型兼容的证据路径。右侧展示了迭代答案优化，其中生成器-优化器循环对这些路径和候选答案进行优化以产生最终答案。

### 3.2. 本体图构建

在大规模知识图谱中，实体级图通常密集且高度异构。随着跳数增加，无约束的以主题实体为中心的扩展很容易产生大量嘈杂的证据路径，导致搜索空间快速增长。这促使我们构建一个紧凑的知识图谱类型级抽象，以便将重复的实体级事实总结为更稳定的关系类型模式。具体来说，我们将事实知识图谱 \(\mathcal{G}\) 抽象为一个以关系为中心的本体图 \(\mathcal{O}\)。在此图中，实体级事实被总结为类型级关系签名，形式为 \((c_h, r, c_t)\)，其中 \(c_h\)

多跳知识图谱问答的本体引导证据路径推理

相似文章

我构建了一个开源知识图谱管道，结合混合检索以改进LLM多跳推理 [P]

有界路径上下文：LLM知识图谱问答中可见路径历史受控研究

ProvenAI：生成答案中的溯源原生证据追踪

@hxiao: 我不是知识图谱的粉丝，但最近出于一个令人惊讶的原因开始更频繁地使用它们：构建非平凡的…

PathoSage：通过经验感知的代理工作流实现病理学中的多源证据裁决

提交意见反馈