基于SSP构建用于细粒度方面级情感分析的评价标注数据
摘要
本文介绍了利用半自动符号传播(SSP)方法,构建用于电子商务评论细粒度方面级情感分析的韩语评价标注语料库(EVAD)。并在该数据集上评估了KoBERT和KcBERT模型,在方面-值对识别任务上取得了较高的F1分数。
arXiv:2605.07446v1 公告类型:新论文
摘要:我们报告了一个韩语评价标注语料库(以下简称“评价标注数据集(EVAD)”)的构建过程,及其在方面级情感分析(ABSA)中的应用。该ABSA方法经过扩展,以涵盖包含情感和非情感语言模式的电子商务评论。标注过程采用半自动符号传播(SSP)技术。我们构建了形式化为有限状态转换器(FST)的丰富语言资源,用于在时尚电商领域对语料库进行详细的ABSA组件标注。为了更准确地分析用户意见并提取目标更详细的特征,该方法通过不仅包含主题和方面,还包含方面值,并根据值是单一、二元还是多元来分类方面-值对,从而扩展了ABSA方法。在评估阶段,KoBERT和KcBERT模型在标注数据集上进行训练,在方面-值对识别任务上分别表现出稳健的性能,F1分数分别为0.88和0.90。
查看缓存全文
缓存时间: 2026/05/11 07:03
# 基于半自动符号传播(SSP)构建面向细粒度基于方面的情感分析的评价标注数据 来源:https://arxiv.org/abs/2605.07446 查看 PDF (https://arxiv.org/pdf/2605.07446) > 摘要:我们报告了一个韩语评价标注语料的构建过程,此后称为“评价标注数据集(EVAD)”,并将其用于扩展的基于方面的情感分析(ABSA),以覆盖包含情感和非情感情感语言模式的电子商务评论。标注过程使用了半自动符号传播(SSP)。我们构建了大量的语言资源,形式化为有限状态转换器(FST),以在时尚电子商务领域对语料进行详细的 ABSA 组件标注。ABSA 方法进行了扩展,通过除主题和方面外还包含方面值,并根据值是一元的、二元的还是多元的分类方面值对,从而更准确地分析用户意见并提取更详细的目标特征。对于评估,KoBERT 和 KcBERT 模型在标注数据集上进行了训练,在方面值对识别方面分别表现出 F1 分数为 0.88 和 F1 分数为 0.90 的鲁棒性能。 ## 提交历史 来自:Eric Laporte \[查看邮件 (https://arxiv.org/show-email/c771e823/2605.07446)\] **\[v1\]**2026年5月8日星期五 08:52:37 UTC \(558 KB\)
相似文章
使用语法与语义上下文评估汇总(SSAS)的情感预测一致性分析
本论文提出了SSAS(语法与语义上下文评估汇总)框架,旨在通过分层分类和迭代汇总来减少噪声和方差,提高基于大语言模型的情感预测的一致性。在三个行业标准数据集上的实证评估显示,数据质量和企业决策可靠性可提升30%。
KoALa-Bench:评估大型音频语言模型在韩语语音理解与忠实度上的表现
KoALa-Bench 推出了一套聚焦韩语的基准测试,从六个维度评估大型音频语言模型,包括全新的语音忠实度指标与韩国本土文化内容。
从基准测试到推理能力:大语言模型在越南法律文本上的双维度大规模评估
为大语言模型在越南法律文本简化任务上提出了一个综合的双维度评估框架,结合了定量基准测试(准确性、可读性、一致性)和跨 GPT-4o、Claude 3 Opus、Gemini 1.5 Pro 和 Grok-1 的定性错误分析。
使用本地语法图为韩语法律聊天机器人生成训练数据集
本文提出了一种利用本地语法图(LGG)为韩语法律聊天机器人生成大规模、带标注训练数据集的方法,在使用 DIET 分类器时达到了 91% 的 F1 分数。
SAGE:用于 LLM 知识评估的可扩展自动化鲁棒性增强
本文介绍了 SAGE,这是一个用于 LLM 知识评估基准测试的可扩展自动化鲁棒性增强框架。该框架使用经过强化学习微调的小模型,以低于现有方法的成本生成和验证问题变体。