GLiNER-Relex:联合命名实体识别与关系提取的统一框架
摘要
GLiNER-Relex 是一个用于联合命名实体识别(NER)与关系提取(RE)的统一框架,利用共享的 Transformer 编码器实现零样本能力。该论文展示了模型在标准基准测试中具有竞争力的性能,并将其作为开源 Python 包发布。
查看缓存全文
缓存时间: 2026/05/13 08:11
论文页面 - GLiNER-Relex:联合命名实体识别与关系抽取的统一框架
来源: https://huggingface.co/papers/2605.10108
摘要
一种用于联合命名实体识别和关系抽取的统一模型,它使用共享的 Transformer 编码器来同时识别实体并提取关系,具备零样本(zero-shot)能力。
联合命名实体识别 (https://huggingface.co/papers?q=Joint%20named%20entity%20recognition) (NER) 和关系抽取 (https://huggingface.co/papers?q=relation%20extraction) (RE) 是自然语言处理中的基础性任务,旨在从无结构文本中构建知识图谱。尽管最近的方法通常将 NER 和 RE 视为需要独立模型处理的不同任务,但我们提出了 GLiNER (https://huggingface.co/papers?q=GLiNER)-Relex,这是一种统一架构,扩展了 GLiNER (https://huggingface.co/papers?q=GLiNER) 框架,使得单个模型能够同时执行实体识别和关系抽取 (https://huggingface.co/papers?q=relation%20extraction)。我们的方法利用共享的双向 Transformer 编码器 (https://huggingface.co/papers?q=bidirectional%20transformer%20encoder) 对文本、实体类型标签和关系类型标签进行联合表示,从而能够在推理时指定任意实体和关系类型,实现零样本抽取 (https://huggingface.co/papers?q=zero-shot%20extraction)。GLiNER (https://huggingface.co/papers?q=GLiNER)-Relex 从已识别的文本片段构建实体对表示 (https://huggingface.co/papers?q=entity%20pair%20representations),并使用专用的关系评分模块 (https://huggingface.co/papers?q=relation%20scoring%20module) 根据关系类型嵌入对其进行评分。我们在四个标准的关系抽取 (https://huggingface.co/papers?q=relation%20extraction) 基准数据集上评估了该模型:CoNLL04 (https://huggingface.co/papers?q=CoNLL04)、DocRED (https://huggingface.co/papers?q=DocRED)、FewRel (https://huggingface.co/papers?q=FewRel) 和 CrossRE (https://huggingface.co/papers?q=CrossRE)。结果表明,该模型在保持 GLiNER (https://huggingface.co/papers?q=GLiNER) 系列特有的计算效率的同时,性能与专用的关系抽取 (https://huggingface.co/papers?q=relation%20extraction) 模型及大型语言模型相比具有竞争力。该模型作为开源 Python 包发布,提供简单的推理 API,允许用户在推理时指定任意的实体和关系类型标签,并通过一次调用同时获取实体和关系三元组。所有模型和代码均已公开。
查看 arXiv 页面 (https://arxiv.org/abs/2605.10108) 查看 PDF (https://arxiv.org/pdf/2605.10108) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.10108)
在您的 Agent 中获取此论文:
hf papers read 2605\.10108
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 0
暂无链接到此论文的模型
在模型的 README.md 中引用 arxiv.org/abs/2605.10108 即可从此页面链接该论文。
引用此论文的数据集 0
暂无链接到此论文的数据集
在数据集的 README.md 中引用 arxiv.org/abs/2605.10108 即可从此页面链接该论文。
引用此论文的 Spaces 0
暂无链接到此论文的 Space
在 Space 的 README.md 中引用 arxiv.org/abs/2605.10108 即可从此页面链接该论文。
包含此论文的合集 0
暂无包含此论文的合集
将此论文添加到合集 (https://huggingface.co/new-collection) 即可从此页面链接该论文。
相似文章
使用大语言模型的跨语言关系抽取:零样本、少样本和微调在罗马尼亚语上的评估
本文通过翻译SemEval-2010 Task 8基准数据集,并在零样本、少样本和QLoRA微调条件下评估Gemma 4,与更小的编码器基线进行比较,研究针对罗马尼亚语的跨语言关系抽取。
ReaORE:大型推理模型驱动的推理引导渐进式开放关系抽取
提出了ReaORE,一个基于推理引导的开放关系抽取框架,通过从粗到细的推理逐步过滤和预测关系,在两个数据集上优于现有基线。
DiZiNER: 分歧引导的指令优化通过模拟试点标注实现零样本命名实体识别
DiZiNER 是一个利用多个大语言模型之间的分歧来优化零样本命名实体识别任务指令的框架,在18个基准测试中的14个上取得了最先进的结果,并显著缩小了零样本与监督系统之间的性能差距。
LELA: 一种基于LLM的端到端实体链接框架,支持零样本领域自适应
LELA是一个基于LLM的实体链接框架,将零样本命名实体识别和实体消解整合为端到端的Python库,并在多种场景下验证了其有效性。
RelGT-AC:用于关系数据库中自动补全任务的关系图变换器
本文介绍了RelGT-AC,一种专门为关系数据库中的自动补全任务设计的关系图变换器架构。该模型在RelGT架构基础上扩展了列掩码以防止平凡解、用于多种预测类型的统一任务头,以及利用词汇信号的TF-IDF文本编码器,在RelBench v2基准测试上取得了显著优于基线的改进。