named-entity-recognition

标签

Cards List
#named-entity-recognition

LC-ICL:标签引导的对比上下文学习用于鲁棒信息抽取

arXiv cs.CL · 21小时前 缓存

本文提出LC-ICL,一种新颖的少样本技术,它同时使用正确和错误的示例以及错误原因标签,以提升大型语言模型在信息抽取任务(如命名实体识别和关系抽取)上的性能。

0 人收藏 0 人点赞
#named-entity-recognition

历史文本中命名实体识别的时间融合策略研究

arXiv cs.CL · 昨天 缓存

本文系统研究了如何将时间元数据结构性地嵌入到面向历史文本的命名实体识别(NER)模型中。通过采用早期或晚期融合机制注入绝对和相对时间表示的实验表明,晚期融合策略在法语和德语历史数据集上展现出更稳健的性能。

0 人收藏 0 人点赞
#named-entity-recognition

HIPE-2026 概述:从多语言历史文本中抽取人物-地点关系

arXiv cs.CL · 5天前 缓存

本文介绍了HIPE-2026的结果,这是HIPE评测系列的第三版,专注于从法语、德语和英语的多语言历史文档中提取基于时间的人物-地点关系。对17个参赛团队在预测准确性、计算效率和跨领域泛化能力方面进行了评估。

0 人收藏 0 人点赞
#named-entity-recognition

AAbAAC:自身免疫信息提取的标注语料库

arXiv cs.AI · 2026-06-12 缓存

AAbAAC是一个手动标注的语料库,包含115篇PubMed摘要,用于自身免疫信息提取,重点关注自身免疫疾病和自身抗体等实体。研究表明,在该语料库上进行微调后,命名实体识别(NER)性能有所提升。

0 人收藏 0 人点赞
#named-entity-recognition

使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 模型进行指令微调

arXiv cs.AI · 2026-06-10 缓存

本文研究了使用 LoRA 和 NEFTune 对 DeepSeek-R1-8B 进行指令微调用于金融命名实体识别,取得了 0.912 的微平均 F1 值,并优于多个基线模型。

0 人收藏 0 人点赞
#named-entity-recognition

SMADE-IE:用于零样本信息抽取的稀疏多智能体证据驱动辩论框架

arXiv cs.CL · 2026-06-04 缓存

SMADE-IE 是一个面向零样本信息抽取的稀疏多智能体框架,通过自适应模式选择器与基于 Toulmin 论证风格和贝叶斯更新的证据驱动辩论机制,在 NER、RE 和 JERE 任务的 9 个基准测试上超越现有基线,同时提升了 token 使用效率。

0 人收藏 0 人点赞
#named-entity-recognition

词与道:面向德国医学自然语言处理的领域特定BERT预训练策略

arXiv cs.CL · 2026-06-03 缓存

本文介绍了ChristBERT,一个基于RoBERTa的面向德国临床NLP的领域特定语言模型家族,并在医学命名实体识别和文本分类任务上评估了三种领域适应策略(继续预训练、从头预训练和词汇适应),取得了最先进的结果。

0 人收藏 0 人点赞
#named-entity-recognition

超越一致性:为策展人筛选评分面板浮现的生物医学实体候选

arXiv cs.CL · 2026-06-01 缓存

本文介绍了BioConCal,一种监督评分器,它利用推理时的面板和候选特征对LLM面板浮现的生物医学实体候选进行排序,在策展人筛选方面显著优于原始一致性。

0 人收藏 0 人点赞
#named-entity-recognition

针对免疫介导疾病的专科医学语言模型

arXiv cs.CL · 2026-05-29 缓存

本文提出了一种针对免疫介导和感染性疾病的专科医学语言模型,用于从临床叙述中提取信息。该模型采用BiLSTM-CNN-Char架构,在371份病例报告的精标语料库上训练,F1得分达到0.89。

0 人收藏 0 人点赞
#named-entity-recognition

LELA: 一种基于LLM的端到端实体链接框架,支持零样本领域自适应

arXiv cs.AI · 2026-05-27 缓存

LELA是一个基于LLM的实体链接框架,将零样本命名实体识别和实体消解整合为端到端的Python库,并在多种场景下验证了其有效性。

0 人收藏 0 人点赞
#named-entity-recognition

从Reddit平台中筛选与提取药物相关实体

arXiv cs.CL · 2026-05-27 缓存

介绍了ReDose数据集,该数据集包含6,435条Reddit帖子,标注了药物、剂量和效果实体,并评估了包括BiomedBERT、Llama-3 70B和GPT-4在内的多种模型的提取性能。

0 人收藏 0 人点赞
#named-entity-recognition

莎士比亚的世界——我以为这很简单,但……

Hacker News Top · 2026-05-26 缓存

作者使用 spaCy NER 和 Claude 从莎士比亚作品中提取地名,然后利用 MapLibre、OpenCage 和 Stadia Maps 构建了交互式地图,可按戏剧筛选地点并显示引文。

0 人收藏 0 人点赞
#named-entity-recognition

UCCI: 校准不确定性实现成本最优的LLM级联路由

arXiv cs.LG · 2026-05-20 缓存

UCCI提出了一种校准优先的路由器,用于LLM级联,它使用等渗回归将令牌级别的边际不确定性映射到错误概率,在生产级NER任务中实现了31%的成本降低,同时保持微F1=0.91,并将期望校准误差从0.12降至0.03。

0 人收藏 0 人点赞
#named-entity-recognition

利用共现比较组装局部语法

arXiv cs.CL · 2026-05-13 缓存

本文提出了一种比较局部语法共现结果的方法,旨在优化葡萄牙语人名命名实体识别,并在 HAREM 数据集上取得了更高的 F-measure 分数。

0 人收藏 0 人点赞
#named-entity-recognition

我在33,000份印度最高法院判决书(1950–2024)上训练了一个NER模型,CASE_CITATION的F1得分达到97.76%,比唯一的先前基线高出17个百分点 [P]

Reddit r/MachineLearning · 2026-05-07

发布了 en_legal_ner_ind_trf v0.1,这是一个在33,000份印度最高法院判决书之上微调的InLegalBERT模型,在案例引用上取得了97.76%的F1得分,显著优于之前的基线。

0 人收藏 0 人点赞
#named-entity-recognition

信息密度对用户生成内容命名实体识别影响的机制与优化研究

arXiv cs.CL · 2026-04-22 缓存

arXiv 预印本指出,信息密度低是 NER 在嘈杂用户生成内容性能崩溃的根本原因,并提出窗口感知优化模块(WOM),在 WNUT2017 上最高提升 F1 4.5%。

0 人收藏 0 人点赞
#named-entity-recognition

DiZiNER: 分歧引导的指令优化通过模拟试点标注实现零样本命名实体识别

arXiv cs.CL · 2026-04-20 缓存

DiZiNER 是一个利用多个大语言模型之间的分歧来优化零样本命名实体识别任务指令的框架,在18个基准测试中的14个上取得了最先进的结果,并显著缩小了零样本与监督系统之间的性能差距。

0 人收藏 0 人点赞
#named-entity-recognition

@mayhewsw 新论文:我知道现在流行把算力规模扩大10倍,让模型一步步思考并使用工具,但……

X AI KOLs Following · 2026-04-19

作者发布了 Universal NER v2,这是一篇将在 LREC 2026 发表的命名实体识别论文,刻意回避了当代的“规模扩张+工具调用”潮流。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈