基于SSP构建用于细粒度方面级情感分析的评价标注数据

arXiv cs.CL 论文

摘要

本文介绍了利用半自动符号传播(SSP)方法,构建用于电子商务评论细粒度方面级情感分析的韩语评价标注语料库(EVAD)。并在该数据集上评估了KoBERT和KcBERT模型,在方面-值对识别任务上取得了较高的F1分数。

arXiv:2605.07446v1 公告类型:新论文 摘要:我们报告了一个韩语评价标注语料库(以下简称“评价标注数据集(EVAD)”)的构建过程,及其在方面级情感分析(ABSA)中的应用。该ABSA方法经过扩展,以涵盖包含情感和非情感语言模式的电子商务评论。标注过程采用半自动符号传播(SSP)技术。我们构建了形式化为有限状态转换器(FST)的丰富语言资源,用于在时尚电商领域对语料库进行详细的ABSA组件标注。为了更准确地分析用户意见并提取目标更详细的特征,该方法通过不仅包含主题和方面,还包含方面值,并根据值是单一、二元还是多元来分类方面-值对,从而扩展了ABSA方法。在评估阶段,KoBERT和KcBERT模型在标注数据集上进行训练,在方面-值对识别任务上分别表现出稳健的性能,F1分数分别为0.88和0.90。
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/11 07:03

# 基于半自动符号传播(SSP)构建面向细粒度基于方面的情感分析的评价标注数据

来源:https://arxiv.org/abs/2605.07446
查看 PDF (https://arxiv.org/pdf/2605.07446)

> 摘要:我们报告了一个韩语评价标注语料的构建过程,此后称为“评价标注数据集(EVAD)”,并将其用于扩展的基于方面的情感分析(ABSA),以覆盖包含情感和非情感情感语言模式的电子商务评论。标注过程使用了半自动符号传播(SSP)。我们构建了大量的语言资源,形式化为有限状态转换器(FST),以在时尚电子商务领域对语料进行详细的 ABSA 组件标注。ABSA 方法进行了扩展,通过除主题和方面外还包含方面值,并根据值是一元的、二元的还是多元的分类方面值对,从而更准确地分析用户意见并提取更详细的目标特征。对于评估,KoBERT 和 KcBERT 模型在标注数据集上进行了训练,在方面值对识别方面分别表现出 F1 分数为 0.88 和 F1 分数为 0.90 的鲁棒性能。

## 提交历史

来自:Eric Laporte \[查看邮件 (https://arxiv.org/show-email/c771e823/2605.07446)\] **\[v1\]**2026年5月8日星期五 08:52:37 UTC \(558 KB\)

相似文章