知识图谱中图到图语义相似性的测量：知识图谱嵌入的实证评估

arXiv cs.AI 2026/06/30 04:00 论文

knowledge-graph semantic-similarity graph-embedding evaluation embedding graph-to-graph

摘要

本文介绍并实证评估了使用知识图谱嵌入测量知识图谱间语义相似性的方法，提出了EmbPairSim和AvgEmbSim评分函数，这些函数在WikiText-2和CC-News数据集上优于Sentence-BERT等基线方法。

arXiv:2606.29180v1 公告类型：新摘要：知识图谱（KG）以结构化三元组的形式表示事实，被广泛用于跨不同领域组织关系型知识。正如文本信息从单词、句子到完整文档不等，KG信息也可以在多个层面进行解释，从实体、关系、三元组到子图和整个KG。然而，现有的KG嵌入方法主要关注实体、关系和三元组，很大程度上未涉及图级语义。传统的图级方法通常基于结构模式比较图，也是不够的，因为仅结构相似性无法保证KG间的语义相似性。为了评估不同方法在捕捉这种图级语义信息方面的能力，我们研究了图到图语义相似性，即判断一对KG是否代表语义上对应的底层信息。为了获得可靠的真实对应关系，我们通过修改文本文档、从原始和修改后的文档中提取KG，并将已知对应关系转移到KG对，构建了一个语义匹配数据集。我们在每个数据集上比较了基于文本、基于结构和基于KG嵌入的方法。对于基于KG嵌入的方法，我们引入了两种评分函数：\textit{EmbPairSim}，使用最大成对实体相似性；以及\textit{AvgEmbSim}，使用频率加权质心。在WikiText-2和CC-News上的实验表明，\textit{EmbPairSim}在MRR上比Sentence-BERT高出高达5.3个百分点，同时使用的参数明显更少。这些结果表明，KGE表示可以作为KG中图到图语义相似性的紧凑而有效的信号。我们的代码可在https://github.com/SeungRyeolBaek/KG-to-KG-Semantic-Similarity获取。

查看原文

查看缓存全文

缓存时间: 2026/06/30 05:32

# 测量知识图谱中的图到图语义相似度：对知识图谱嵌入方法的实证评估
来源：https://arxiv.org/html/2606.29180
SeungRyeol Baek, Wooseok Sim
韩国成均馆大学计算机科学与工程系
以及 Hogun Park
韩国成均馆大学计算机科学与工程系

###### 摘要.

知识图谱（KG）以结构化三元组的形式表示事实，被广泛应用于跨领域组织关系型知识。正如文本信息可以从单词、句子到完整文档进行多层次解读，KG信息也可以从实体、关系、三元组到子图和完整KG进行多层级理解。然而，现有的KG嵌入方法主要关注实体、关系和三元组，而图级语义在很大程度上未被充分处理。传统的图级方法通常基于结构模式比较图，但这也是不足的，因为仅凭结构相似性无法保证KG之间的语义相似性。为了评估不同方法捕捉这种图级语义信息的能力，我们研究了图到图语义相似度，即判断一对KG是否表示了语义上对应的底层信息。为了获得可靠的真实对应关系，我们通过修改文本文档、从原始文档和修改后的文档中提取KG，并将其已知的对应关系迁移到KG对上，从而构建了一个语义匹配数据集。我们在每个数据集上比较了基于文本、基于结构和基于KG嵌入的方法。在基于KG嵌入的方法中，我们引入了两种评分函数：EmbPairSim（使用最大成对实体相似度）和 AvgEmbSim（使用频率加权中心点）。在 WikiText-2 和 CC-News 上的实验表明，EmbPairSim 在参数数量大幅减少的情况下，MRR 比 Sentence-BERT 高出最多 5.3 个百分点。这些结果表明，KGE 表示可以作为 KG 中图到图语义相似度的紧凑且有效的信号。我们的代码可在 https://github.com/SeungRyeolBaek/KG-to-KG-Semantic-Similarity 获取。

知识图谱，知识图谱嵌入，语义相似度，知识图谱相似度

## 1. 引言

*知识图谱*（KG）以三元组 \((h, r, t)\) 的形式表示一个事实，该三元组通过一个类型化的关系 \(r\) 将头实体 \(h\) 连接到尾实体 \(t\)——例如 \((Paris, located\_in, France)\)。由于其能够以结构化形式组织复杂的关系型知识，KG 已成为跨领域广泛采用的知识表示方式。示例包括维基数据中的百科知识 (Vrandečić and Krötzsch, 2014 (https://arxiv.org/html/2606.29180#bib.bib27))、BioKG 中的生物医学知识 (Zhang et al., 2025 (https://arxiv.org/html/2606.29180#bib.bib26))、LegalKG 中的法律知识 (Filtz, 2017 (https://arxiv.org/html/2606.29180#bib.bib24))、ORKG 中的学术知识 (Jaradeh et al., 2019 (https://arxiv.org/html/2606.29180#bib.bib23))、EventKG 中的事件中心知识 (Guan et al., 2023 (https://arxiv.org/html/2606.29180#bib.bib22))，以及场景图中的视觉关系 (Krishna et al., 2017 (https://arxiv.org/html/2606.29180#bib.bib25))。

KG 中存储的信息可以在多个层级上进行分析，从实体和关系到三元组、子图以及完整的 KG。实体和关系表示单个单元及其之间的连接类型。三元组表示具体的关系事实。由多个三元组构成的子图可以捕捉更广泛的语义单元，例如事件、研究贡献或场景区域。一个完整的 KG 可以表示一个完整的信息来源，例如百科、生物医学、学术、视觉或文档推导的知识。附录 A (https://arxiv.org/html/2606.29180#A1) 在代表性 KG 领域中展示了这种多层级视图。这种视图类似于文本信息，后者可以在从单个单词、句子到完整文档的不同层级上进行研究。

尽管 KG 的语义表示已被广泛研究，但大多数现有方法关注的是局部组件，如实体、关系和三元组，而不是子图或完整 KG。以三元组为中心的语言模型方法，如 KG-BERT (Yao et al., 2019 (https://arxiv.org/html/2606.29180#bib.bib1))、KEPLER (Wang et al., 2021 (https://arxiv.org/html/2606.29180#bib.bib3)) 和 RLKB (Fan et al., 2017 (https://arxiv.org/html/2606.29180#bib.bib56))，将单个三元组转换为文本，并用 Transformer (Vaswani et al., 2017 (https://arxiv.org/html/2606.29180#bib.bib2)) 进行编码，但主要依赖三元组级语义，而非整个 KG 的图结构。知识图谱嵌入（KGE）模型，包括直推式方法 (Bordes et al., 2013 (https://arxiv.org/html/2606.29180#bib.bib37); Yang et al., 2015 (https://arxiv.org/html/2606.29180#bib.bib38); Trouillon et al., 2016 (https://arxiv.org/html/2606.29180#bib.bib39); Sun et al., 2019 (https://arxiv.org/html/2606.29180#bib.bib40)) 和归纳式方法 (Lee et al., 2023 (https://arxiv.org/html/2606.29180#bib.bib41))，同时结合了语义和结构信息。然而，这些方法主要建模局部 KG 组件，如实体、关系和三元组，而非整个 KG 所表示的语义信息。

在图级层面处理 KG 可能看起来与传统图级任务一致。然而，传统图级任务通常基于结构模式（如拓扑、连通性和子结构）来表征图。这种结构视角很有用，但对于 KG 来说并不足够，因为 KG 是通过组织语义信息构建的。特别是，仅凭结构相似性无法保证两个 KG 表示相似的信息。

参见图注。
图 1. 我们的语义匹配任务概述。

综上所述，这些局限性表明 KG 中的图级语义信息仍未得到充分处理。因此，我们旨在评估不同类型的方法在捕捉整个 KG 所表示的语义信息方面的能力。为此，一个自然的评估设置是图到图语义相似度，即应在其他候选图中识别出语义上对应的 KG。具体来说，我们将任务定义为判断两个 KG 是否在图级层面表示相同的底层信息，而不是仅仅检查它们是否共享相似的结构。图 1 (https://arxiv.org/html/2606.29180#S1.F1) 展示了该任务示例。给定一个查询 KG \(G_q\)（顶部），我们对候选图 \(\{G_i\}\) 进行排序，使得编码“相同真实世界情况”的那个图排在首位。一个有效的度量方法需要具备语义感知能力以桥接词汇变化，结构敏感性以考虑图级组织，以及可扩展性以处理文档规模大小的 KG。

然而，为了评估这个任务，我们需要 KG 之间可靠的真实对应关系。从现有的 KG 中获得这种对应关系很困难，因为这些 KG 往往已经过图形式的预处理，难以追溯其原始来源或判断两个独立构建的 KG 是否应被视为语义相似。为了获得可控的语义对应关系，我们转而从文本文档入手。通过应用保留语义的修改（如词汇替换和释义），每个原始文档可以与其表示相同底层信息的修改后文档配对。在将原始文档和修改后文档都转换为 KG 后，已知的文档级对应关系可以迁移到所得的 KG 对上。这使得我们能够构建评估数据，其中每个查询 KG 都有一个明确的真实对应对象。

基于这一思路，我们构建了一个语义匹配数据集：(i) 来自 WikiText-2 和 CC-News 的文档通过 LLM 流水线解析为 KG；(ii) 每个文档在六个词汇/结构强度等级上进行释义；(iii) 从释义文本中重新提取 KG；(iv) 每个查询图必须在数百个干扰项中检索出其真实的对应图。我们报告了图对之间的 Hits@5、MRR 和 NDCG。

使用每个数据集，我们实证比较了基于文本、基于结构和基于 KG 嵌入的方法在图到图语义相似度上的表现。对于基于 KG 嵌入的方法，我们引入了两种互补的评分函数，将现成的 KGE 提升到图级：(1) EmbPairSim：计算两个图中实体（以及可选的关系）之间的最大成对余弦相似度，保留细粒度的对应关系；(2) AvgEmbSim：为每个图形成一个单一频率加权中心向量，实现更高效的检索。

为了进行比较，我们使用 Sentence-BERT (SBERT) (Reimers and Gurevych, 2019 (https://arxiv.org/html/2606.29180#bib.bib48)) 作为基于文本的方法，使用图核方法 (Sugiyama and Borgwardt, 2015 (https://arxiv.org/html/2606.29180#bib.bib35); Shervashidze et al., 2011 (https://arxiv.org/html/2606.29180#bib.bib36)) 作为基于结构的方法。对于 SBERT，KG 三元组在输入前先进行文本化。在我们的数据集上，EmbPairSim 在参数数量大幅减少的情况下，MRR 比 Sentence-BERT 高出最多 5.3 个百分点。这些结果表明，KGE 表示可以作为 KG 中图到图语义相似度的紧凑且有效的信号。

我们的主要贡献如下：

- • 任务与数据集。据我们所知，我们发布了首个专门针对受控释义条件下文档推导的 KG 到 KG 语义检索的基准测试。
- • 轻量级 KGE 聚合。我们提出了 EmbPairSim 和 AvgEmbSim，这两种评分函数无需重新训练，运行时间在亚秒级。
- • 实证发现。EmbPairSim 在参数数量少一个数量级的情况下，MRR 比 Sentence-BERT 高出最多 5.3 个百分点；消融研究表明，频率加权通常有帮助，均值中心化对于基于 INGRAM 的相似度很重要，而关系嵌入可能引入噪声。

## 2. 相关工作

### 2.1. 基于语言的表示

词嵌入如 Word2Vec (Mikolov et al., 2013a (https://arxiv.org/html/2606.29180#bib.bib47)) 将上下文相似的词在连续向量空间中表示得彼此接近。句子级模型如 Sentence-BERT (SBERT) (Reimers and Gurevych, 2019 (https://arxiv.org/html/2606.29180#bib.bib48)) 通过跨 token 捕捉上下文信息，将这一点扩展到整个句子或文档。这些嵌入支持语义相似度、检索和聚类。在我们的工作中，我们利用 SBERT 来测量文本化的知识图谱（KG）之间的语义相似度。这种方法作为评估图级相似度的基于语言基线的基准。

### 2.2. 基于结构的方法

基于图的方法通过识别匹配的子结构或编辑操作来比较图结构。早期方法如图编辑距离 (GED) (Abu-Aisheh et al., 2015 (https://arxiv.org/html/2606.29180#bib.bib45)) 和 Ullmann 的子图匹配 (Ullmann, 1976 (https://arxiv.org/html/2606.29180#bib.bib46)) 提供了精确的结构相似度，但计算成本高且可扩展性差。图核方法通过基于统计模式将图映射到高维特征空间来解决这一问题，从而能够高效计算相似度。示例包括顶点和边直方图核 (Sugiyama and Borgwardt, 2015 (https://arxiv.org/html/2606.29180#bib.bib35))（使用标签分布）以及 Weisfeiler-Lehman (WL) 核 (Shervashidze et al., 2011 (https://arxiv.org/html/2606.29180#bib.bib36))（通过迭代重新标记节点来捕捉多层次结构信息）。这些核在结构细节和可扩展性之间取得了平衡，使其适用于大型图。在我们的工作中，我们使用图核作为基于结构的基线，以评估表面级结构特征在多大程度上近似 KG 之间的语义相似度。

### 2.3. 知识图谱嵌入（KGE）方法

知识图谱嵌入（KGE）方法将实体和关系映射到连续向量空间，同时保留结构属性。它们支持链接预测、实体分类和图补全等任务。TransE (Bordes et al., 2013 (https://arxiv.org/html/2606.29180#bib.bib37)) 将关系建模为嵌入空间中的平移，而 DistMult (Yang et al., 2015 (https://arxiv.org/html/2606.29180#bib.bib38)) 使用基于逐元素交互的乘法评分函数。ComplEx (Trouillon et al., 2016 (https://arxiv.org/html/2606.29180#bib.bib39)) 通过使用复数嵌入来扩展以处理更丰富的关系模式，RotatE (Sun et al., 2019 (https://arxiv.org/html/2606.29180#bib.bib40)) 将关系建模为复数空间中的旋转。这些模型是直推式的，需要在训练期间看到所有实体和关系。相比之下，INGRAM (Lee et al., 2023 (https://arxiv.org/html/2606.29180#bib.bib41)) 遵循归纳范式：图神经网络直接从其局部图结构为未见过的实体和关系推导嵌入。它完全依赖于结构上下文，不保留训练期间产生的任何实体或关系向量。这些 KGE 模型类似于词嵌入，但同时编码了图特定的结构。我们将其用作结构感知的基线，以评估图级语义相似度。

## 3. 预备知识

### 3.1. 符号说明

知识图谱（KG）定义为一个元组 \(G = (\mathcal{E}, \mathcal{R}, \mathcal{T})\)，其中 \(\mathcal{E}\) 是实体集（\(|\mathcal{E}|\) 表示其大小），\(\mathcal{R}\) 是关系集（\(|\mathcal{R}|\) 表示其大小），而 \(\mathcal{T} \subseteq \{(h, r, t) \mid h, t \in \mathcal{E}, r \in \mathcal{R}\}\) 是三元组集，\(|\mathcal{T}|\) 是其总数。每个三元组 \((h, r, t)\) 表示通过关系 \(r\) 从头实体 \(h\) 到尾实体 \(t\) 的有向关系。因此，KG 可以看作一个以实体为节点、三元组为边的有向标记图。

### 3.2. 作为文档的知识图谱

文本数据呈现出层次结构：词组成句子，句子组合成段落，段落构成文档。尽管知识图谱以非线性网络的形式组织实体和关系，没有固定的阅读顺序，但我们可以通过相同的层次结构来看待它：实体和关系充当词语，每个三元组充当一个句子，而子图或整个图则充当段落甚至完整的文档。这样看待 KG 使我们能够应用文档级操作（如相似度测量），同时捕捉结构和语义。

### 3.3. 基于图核的方法

作为测量 KG 之间相似度的基线，我们使用图核方法。给定两个 KG \(G\) 和 \(G'\)，它们的相似度计算如下：

(1) \(S_{\text{kernel}} = K(G, G')\)。

这种方法纯粹依赖于结构特征。我们在主要实验中使用两种核：顶点直方图核 (Sugiyama and Borgwardt, 2015 (https://arxiv.org/html/2606.29180#bib.bib35)) 和 Weisfeiler-Lehman (WL) 核 (Shervashidze et al., 2011 (https://arxiv.org/html/2606.29180#bib.bib36))。顶点直方图核比较离散实体标识符的分布，而不使用学习到的语义嵌入。WL 核通过迭代重新标记节点进一步结合了局部图拓扑。

知识图谱中图到图语义相似性的测量：知识图谱嵌入的实证评估

相似文章

使用知识图谱嵌入的自动化大数据质量评估

知识图谱增强的零样本主题分类：多策略比较研究

用于评估知识图谱构建方法和图神经网络的统一基准

增强元认知AI：基于图论的大语言模型富集的知识图谱填充

@hxiao: 我不是知识图谱的粉丝，但最近出于一个令人惊讶的原因开始更频繁地使用它们：构建非平凡的…

提交意见反馈