基于方面的情感演化及其与多轮同行评审中评审轮次的相关性:一种深度学习方法

arXiv cs.CL 论文

摘要

本文利用深度学习方法(LCF-BERT-CDM)研究了《自然·通讯》多轮同行评审中方面级情感的分布与演化,实现了82.65%的宏F1值,并发现随着评审轮次增加,正面情感上升而负面情感下降。

arXiv:2606.24188v1 公告类型:新 摘要:从同行评审评论的文本内容中挖掘情感信息,可为科学评价过程提供有价值的见解。然而,以往的研究常受限于粗粒度分析且缺乏对评审轮次的区分。值得注意的是,评审者在多个评审阶段中关注点和情感倾向的动态变化仍未得到充分探索。为弥补这一空白,本研究考察了方面级情感的分布与演化,并探讨其与评审轮次数量的相关性。我们首先对《自然·通讯》中11,063篇已接收论文的多轮评审评论进行分割,识别出细粒度的评审方面聚类。随后构建了约5,000条评审语句的人工标注语料库。基于该数据集,我们训练了一系列基于深度学习的方面情感分类模型。其中,LCF-BERT-CDM模型表现最佳,宏F1值达到82.65%。后续统计分析揭示了一致趋势:随着评审轮次增加,正面情感比例上升,而负面情感比例下降。相关性分析进一步表明,方面情感得分与评审轮次总数呈负相关。相关性较强的关键方面包括“实验”、“研究意义”和“结果分析”。
查看原文
查看缓存全文

缓存时间: 2026/06/24 07:45

# 基于方面的情感演化及其与多轮同行评审中评审轮次的相关性:一种深度学习方法  
来源:https://arxiv.org/abs/2606.24188  
查看PDF(https://arxiv.org/pdf/2606.24188)  

> 摘要:从同行评审评论文本中挖掘情感信息,可为科学评估过程提供有价值的见解。然而,以往的研究往往受限于粗粒度分析,且缺乏对不同评审轮次的区分。值得注意的是,评审者在多个评审阶段中关注点和情感倾向的动态变化仍未得到充分探索。为弥补这一空白,本研究考察了方面级情感的分布与演化,并探讨其与评审轮次数量的相关性。我们首先对来自Nature Communications的11,063篇已接收论文的多轮评审意见进行分割,并识别细粒度的评审方面聚类。随后构建了一个约5,000条评审句子的人工标注语料库。利用该数据集,我们训练了一系列基于深度学习的方面情感分类模型。其中,LCF-BERT-CDM模型表现最佳,宏F1分数达到82.65%。后续统计分析显示出一致趋势:随着评审轮次增加,积极情感比例上升,消极情感比例下降。相关性分析进一步表明,方面情感分数与总评审轮次数量呈负相关。相关性较强的关键方面包括“实验”、“研究意义”和“结果分析”。

## 提交历史

作者:张成志 \[查看电子邮件(https://arxiv.org/show-email/2dec3645/2606.24188)\] **\[v1\]** 2026年6月23日星期二 06:14:00 UTC(40,598 KB)

相似文章

基于SSP构建用于细粒度方面级情感分析的评价标注数据

arXiv cs.CL

本文介绍了利用半自动符号传播(SSP)方法,构建用于电子商务评论细粒度方面级情感分析的韩语评价标注语料库(EVAD)。并在该数据集上评估了KoBERT和KcBERT模型,在方面-值对识别任务上取得了较高的F1分数。

Sem-Detect: 面向语义级别的AI生成同行评审检测方法

arXiv cs.CL

Sem-Detect 提出了一种结合文本特征与声明级语义分析的方法,用于区分AI生成的同行评审与人类撰写的评审。在0.1%假阳性率下,其真阳性率相比基线提升了25.5%,并且表明经过大语言模型润色的人类评审仍保留独特的语义信号,仅有不到3.5%被误判为AI生成。

无监督情感神经元

OpenAI Blog

OpenAI 展示了一个无监督系统,通过训练乘法 LSTM 来预测亚马逊评论中的下一个字符,学习情感表示。该系统在斯坦福情感树库(Stanford Sentiment Treebank)上实现了最先进的情感分析效果(91.8% 准确率),同时所需的标注样本比监督学习方法少 30-100 倍。模型发现了一个独特的'情感神经元',能够捕捉情感信息,可以直接操纵来控制文本生成的情感。

通过联合生成与评估实现自进化深度研究

arXiv cs.CL

来自香港科技大学、字节跳动和UCL的研究人员提出了SCORE——一种协同进化训练框架,将LLM同时训练为深度研究报告生成器和评估器,并通过元约束机制动态调整评估难度,防止奖励饱和。实验表明,该方法在开放式研究报告质量上取得了持续提升。