ReaORE:大型推理模型驱动的推理引导渐进式开放关系抽取

arXiv cs.CL 论文

摘要

提出了ReaORE,一个基于推理引导的开放关系抽取框架,通过从粗到细的推理逐步过滤和预测关系,在两个数据集上优于现有基线。

arXiv:2606.26986v1 声明类型:新 摘要:开放关系抽取(OpenRE)要求模型从非结构化文本中提取头尾实体之间未见过的关系,以应用于实际场景。OpenRE的核心挑战在于实现对未见关系类型的可靠泛化。当前OpenRE方法要么采用聚类技术,这种方法无法生成关系标签且泛化能力差,要么依赖大型语言模型(LLMs)直接生成关系标签,但这类方法缺乏足够的辨别能力来区分容易混淆的关系。为克服这些局限,我们提出了推理引导的渐进式开放关系抽取(ReaORE),一种通过从粗到细的关系推理来执行关系抽取的框架。具体而言,ReaORE包含两个关键阶段:(i)关系过滤,通过多方面推理理解关系和实例,生成初始关系集,并进一步通过基于嵌入的相似性补充和过滤关系,确保目标关系被包含在内;(ii)关系预测,旨在通过细粒度比较推理从上述集合中预测目标关系,以更好地区分容易混淆的关系。在两个广泛使用的OpenRE数据集上的大量实验表明,ReaORE优于现有基线。
查看原文
查看缓存全文

缓存时间: 2026/06/26 05:20

# ReaORE:基于推理引导的渐进式开放关系抽取——以大型推理模型为驱动

来源:https://arxiv.org/html/2606.26986

Xin Lin1,2††感谢:同等贡献。Liang Zhang211footnotemark:1Guoqi Ma2Hongyao Tu2Jinsong Su1,2††感谢:通讯作者。  
1厦门大学健康与医学数据科学国家研究所,中国  
2厦门大学信息学院  
{linxin1,lzhang}@stu.xmu.edu.cn, [email protected]  

###### 摘要

开放关系抽取(OpenRE)要求模型从非结构化文本中提取头尾实体之间的未见关系,以应用于现实场景。OpenRE的核心挑战在于实现对未见关系类型的可靠泛化。当前OpenRE方法要么采用聚类技术,无法生成关系标签且泛化能力差,要么依赖大型语言模型(LLM)直接生成关系标签,但缺乏足够的区分能力来辨别易混淆关系。针对这些局限,我们提出**ReaORE**——一种基于推理引导的渐进式开放关系抽取框架,通过从粗到细的关系推理来完成关系抽取。具体而言,ReaORE包含两个关键阶段:(i) 关系过滤,该阶段从多个方面进行推理以理解关系和实例,生成初始关系集合,并进一步通过基于嵌入的相似度补充和过滤关系,确保目标关系被包含在内;(ii) 关系预测,旨在通过细粒度对比推理从上述集合中预测目标关系,从而更好地区分易混淆关系。在两个广泛使用的OpenRE数据集上的大量实验表明,ReaORE优于现有基线方法。111我们的代码将在论文被接收后发布。

## 1 引言

参见图注

图1:开放关系抽取方法对比。

关系抽取(RE)旨在识别非结构化文本中头尾实体之间的潜在关系 [Diaz-Garcia and Lopez (2025)](https://arxiv.org/html/2606.26986#bib.bib3)。作为一项基础信息抽取任务,它提供了支持知识库构建 [Ji and Grishman (2011)](https://arxiv.org/html/2606.26986#bib.bib12) 和问答系统 [Yu et al. (2017)](https://arxiv.org/html/2606.26986#bib.bib25) 等下游应用的关键关系事实信息。传统RE固有限制于预定义的关系类型,无法泛化到现实场景中不断涌现的新关系。为解决此问题,开放关系抽取(OpenRE)[Zhao et al. (2023)](https://arxiv.org/html/2606.26986#bib.bib28); [Tu et al. (2025)](https://arxiv.org/html/2606.26986#bib.bib19) 得到了广泛研究,旨在提取训练期间未见的新型关系。然而,由于目标关系类型在训练中不可见,模型缺乏足够的区分特征来刻画它们,导致对未见面关系的泛化能力差。

现有OpenRE方法大致可分为两类:基于聚类的方法和基于LLM的直接关系标签生成方法。前者通常将实例和一些重要的相关信息编码到潜在空间中的嵌入中 [Hu et al. (2020)](https://arxiv.org/html/2606.26986#bib.bib8); [Zhao et al. (2021)](https://arxiv.org/html/2606.26986#bib.bib27), [2023](https://arxiv.org/html/2606.26986#bib.bib28); [Wang et al. (2025a)](https://arxiv.org/html/2606.26986#bib.bib21), [2024](https://arxiv.org/html/2606.26986#bib.bib20)。这些嵌入随后基于它们之间的相对距离进行聚类,每个聚类代表一个潜在的未见面关系,如图1(a)所示。然而,为每个聚类分配语义标签需要大量的后处理工作,使得这些方法本质上是关系聚类而非关系抽取。此外,它们对训练数据的严重依赖导致泛化能力差。

鉴于强大的LLM在各种自然语言处理任务中的能力 [Xu et al. (2024)](https://arxiv.org/html/2606.26986#bib.bib23),它们具有为OpenRE提供先验知识和语义理解的巨大潜力。更重要的是,与传统的基于聚类的方法不同,LLM的生成特性使它们能够直接以自然语言形式预测关系 [Tu et al. (2025)](https://arxiv.org/html/2606.26986#bib.bib19),如图1(b)所示。然而,直接生成关系阻止了模型从多个角度全面理解实例和关系,导致区分能力不足,难以辨别易混淆关系。

大型推理模型(LRM)[Guo et al. (2025)](https://arxiv.org/html/2606.26986#bib.bib4); [Jaech et al. (2024)](https://arxiv.org/html/2606.26986#bib.bib11); [Team (2024)](https://arxiv.org/html/2606.26986#bib.bib18) 以其生成显式、广泛的长推理链的能力为特征,这赋予了模型更强的分析、理解和推理能力,在数学推理和代码生成等复杂任务中已得到证明。[Huang et al. (2025)](https://arxiv.org/html/2606.26986#bib.bib9); [Pelaccia et al. (2025)](https://arxiv.org/html/2606.26986#bib.bib16); [Wang et al. (2025b)](https://arxiv.org/html/2606.26986#bib.bib22)。利用这种深度理解能力,LRM可以从粗到细地逐步分析实例和关系,实现对关系语义和实例特征更准确的理解。更重要的是,推理是一种可泛化的能力:通过真正理解关系语义,LRM可以为未见面关系生成有依据的预测,而这恰好解决了OpenRE的核心泛化需求。此外,即使对于易混淆关系,推理也使模型能够通过深入分析显式推导出判断证据,从而产生可靠的预测。因此,将推理融入OpenRE是一个极具前景的研究方向。

本文中,我们提出了一种基于推理引导的渐进式OpenRE框架(ReaORE),通过显式的关系推理执行从粗到细的关系抽取。在ReaORE中,第一阶段是关系过滤,通过对全局语义和实体类型的粗粒度推理找到与输入实例兼容的关系,并通过基于嵌入的相似度进一步补充和过滤它们。第二阶段是关系预测,执行细粒度对比推理,显式生成排他性的判断证据,以准确区分易混淆关系并确定最终预测。

总之,我们的主要贡献如下:

- • 我们提出了ReaORE,一个基于推理的渐进式OpenRE框架,通过推理增强模型对未见面关系的泛化能力。
- • 我们引入了一种细粒度对比推理策略,有效区分易混淆关系,从而实现更好的关系泛化。
- • 在两个广泛使用的OpenRE基准数据集上进行的大量实验表明,ReaORE显著优于现有基线方法,为用深思熟虑的推理增强OpenRE提供了一种可行的解决方案。

参见图注

图2:ReaORE框架概览。ReaORE遵循从粗到细的过程:首先通过基于匹配的推理模型 \(\mathcal{M}_1\) 和嵌入模型 \(\mathcal{M}_2\) 过滤未见面关系,然后通过细粒度对比推理模型 \(\mathcal{M}_3\) 预测最终关系。\(\mathcal{M}_1\) 和 \(\mathcal{M}_3\) 使用长推理链数据进行微调,而 \(\mathcal{M}_2\) 无需训练。

## 2 任务形式化

在介绍框架之前,我们先给出初步符号。令 \(\mathcal{R}_k\) 表示训练期间观察到的已知关系集合,\(\mathcal{R}_u\) 表示用于评估的未见面关系集合,其中 \(\mathcal{R}_k \cap \mathcal{R}_u = \emptyset\)。训练期间,模型可以访问与 \(\mathcal{R}_k\) 中关系关联的带标签实例。测试时,给定一个无标签数据集 \(\mathcal{D} = \{x_i\}_{i=1}^N\),每个实例 \(x_i = \langle s_i, h_i, t_i \rangle\) 包含一个句子 \(s_i\)、一个头实体 \(h_i\) 和一个尾实体 \(t_i\)。目标是预测一个关系标签 \(\hat{r}_i \in \mathcal{R}_u\),该标签最好地描述 \(s_i\) 中 \(h_i\) 和 \(t_i\) 之间表达的语义关系。对于每次关系抽取,我们不提供额外信息,如实例描述或补充实体信息。ReaORE利用LRM的先验知识和语义理解,从输入上下文中推断关系语义及头尾实体约束。这种形式化反映了真实世界的OpenRE场景:新的、未知的关系不断涌现,但没有为这些未见面关系提供带标签的训练实例,也没有超出原始实例文本之外的补充知识来辅助分析。

由于基于聚类的方法和直接关系标签生成方法常常面临泛化能力有限和预测不可靠的问题,ReaORE首先通过基于匹配的推理和基于嵌入的关系重排序推导出一个紧凑的候选集合 \(\mathcal{R}_c\),然后在 \(\mathcal{R}_c\) 上执行细粒度对比推理以确定最终预测。

## 3 方法论

本节中,我们介绍ReaORE——一个基于推理引导的渐进式OpenRE框架,通过从粗到细的关系推理提取未见面关系。ReaORE不直接生成关系标签或对实例进行聚类,而是将预测分解为两个阶段:关系过滤和关系预测。关系过滤首先通过粗粒度推理识别与输入实例兼容的关系,然后通过基于嵌入的重排序细化 \(\mathcal{R}_c\) 以提高关系覆盖率。关系预测进一步对 \(\mathcal{R}_c\) 应用细粒度对比推理,为最终决策生成显式的判断证据。图2提供了框架概览。

### 3.1 关系过滤

关系过滤旨在初步构建 \(\mathcal{R}_c\),使其在未见面关系类型上紧凑且保持高覆盖率。它包含两个互补步骤:基于匹配的推理首先提供粗粒度的二值判断,关系重排序则利用嵌入空间相似度恢复被推理模型遗漏的合理关系。

**基于匹配的推理。** 对于每个输入实例 \(x_i = \langle s_i, h_i, t_i \rangle\),基于匹配的推理模型 \(\mathcal{M}_1\) 首先对句子 \(s_i\) 进行查询分析,以更好地理解其含义,然后在给定上下文中分析头尾实体类型。此步骤使输入证据更明确,确保后续关系匹配基于句子事实和实体类型,而不仅仅是表面标签相似度。查询分析后,\(\mathcal{M}_1\) 继续生成推理,对每个关系 \(r\) 进行模式匹配。模型首先解释 \(r\) 的自然语言含义,并推断其预期的头侧和尾侧参数约束。然后,它从三个方面判断 \(r\) 是否与 \(x_i\) 匹配。**语义匹配** 确定关系含义是否被 \(s_i\) 中的事实明确支持;模型必须标识支持或反驳 \(r\) 的关键证据,或说明缺失了哪些信息。**头实体类型匹配** 检查 \(h_i\) 是否满足 \(r\) 的头侧参数约束,而**尾实体类型匹配** 检查 \(t_i\) 是否满足 \(r\) 的尾侧参数约束。每个匹配结果用布尔值表示,1表示匹配,0表示不匹配,每个判断都附带解释性理由。图3(a)给出了此基于匹配的推理记录的简略示例。关系 \(r\) 的总匹配分数计算为 \(S(r) = S_s(r) + S_h(r) + S_t(r)\),其中 \(S_s(r), S_h(r), S_t(r) \in \{0,1\}\) 分别表示语义匹配、头实体类型匹配和尾实体类型匹配的二值判断。\(S(r)\) 越高,意味着更多匹配方面支持关系 \(r\) 由 \(x_i\) 表达。基于这些多方面判断,\(\mathcal{M}_1\) 在关系过滤阶段生成初始关系层级:\(\mathcal{R}_1 = \{r \mid S(r) < 2\}\),\(\mathcal{R}_2 = \{r \mid S(r) = 2\}\),\(\mathcal{R}_3 = \{r \mid S(r) = 3\}\)。

参见图注

(a) 基于匹配的推理记录。
(b) 对比推理记录。
图3:ReaORE产生的结构化推理记录示例。(a) 基于匹配的推理记录分析查询,并从语义、头实体类型和尾实体类型角度评估关系。(b) 对比推理记录总结了 \(\mathcal{R}_c\) 上的成对比较及最终决策。

**关系重排序。** 在 \(\mathcal{M}_1\) 产生基于分数的关系层级后,一些合理的关系可能仍被放在较低层级,因为句子隐含地表达了该关系或匹配证据不完整。为了提高目标关系覆盖率,ReaORE应用嵌入模型 \(\mathcal{M}_2\),通过基于嵌入的相似度补充层级。如图2所示,\(\mathcal{R}_i\) 表示 \(\mathcal{M}_1\) 产生的基于分数的层级之一,其中 \(i \in \{1,2,3\}\)。对于源层级 \(\mathcal{S}\),\(\mathcal{M}_2\) 编码输入实例 \(x_i\) 和 \(\mathcal{S}\) 中的所有关系。它根据关系嵌入将 \(\mathcal{S}\) 划分为关系聚类 \(\mathcal{C}(\mathcal{S}) = \{C_1, \ldots, C_K\}\),其中每个 \(C_j \subseteq \mathcal{S}\) 是一组关系标签。令 \(\mathbf{m}_j\) 表示聚类 \(C_j\) 的质心嵌入,通过对 \(C_j\) 中关系的嵌入取均值池化得到。与 \(x_i\) 最相似的聚类通过下式选择:
\[
k^*(\mathcal{S}) = \arg\max_j \cos(\mathbf{m}_j, \mathbf{e}_{x_i}),
\]
其中 \(\mathbf{e}_{x_i}\) 是输入实例的嵌入。我们将选中的关系聚类记为 \(C^*(\mathcal{S}) = C_{k^*(\mathcal{S})}\)。

相似文章

大型学习模型中增强且高效的推理

arXiv cs.AI

本文提出了一种改进大型语言模型推理的方法,通过重新编码数据以显式表示关系,实现高效且原则性的推理,并具备关系规则的多项式时间可学习性,从而解决幻觉问题并支持跨多次调用的可靠推理。

ReasonOps: 面向LLM推理轨迹的算子分割

arXiv cs.AI

ReasonOps 提出了一种无监督方法,用于对大型推理模型的思维链轨迹进行标注,识别出 7 个常出现的推理算子。该方法支持对 12 个模型和 8 个基准上的推理结构、模型识别和正确性预测进行分析。

GraphReAct:面向多步图推理的推理与行动

arXiv cs.AI

本文介绍了 GraphReAct,这是一个将推理与行动范式扩展到图结构数据以进行多步推理的框架。它结合了拓扑检索、语义检索以及上下文精炼,以提升在图学习基准测试上的性能。