利用人类阅读时产生的认知信号增强微博关键词提取

arXiv cs.CL 2026/06/26 04:00 论文

cognitive-signals keyphrase-extraction microblogs eeg eye-tracking natural-language-processing

摘要

本文研究了脑电图信号能否补充眼动追踪信号用于微博的自动关键词提取。使用ZuCo语料库，作者表明认知信号，特别是脑电图信号，在不同模型上均能提升自动关键词提取的性能。

arXiv:2606.26485v1 公告类型：新摘要：微博平台产生了大量简短、嘈杂且分散的用户内容，使得自动关键词提取成为一项重要但具有挑战性的任务。以往研究利用眼动追踪信号来改善基于微博的关键词提取，因为此类信号反映了读者对显著词汇的关注。然而，仅凭眼动追踪受到生理、采集和特征解码方面的限制。针对这一问题，我们研究了脑电图信号能否补充眼动追踪信号用于关键词提取。使用ZuCo认知语言处理语料库，我们选取了8个脑电图特征和17个眼动追踪特征，并将其融入基于微博的关键词提取模型中。为减少模型结构对认知信号可能造成的扭曲，我们将这些特征注入到软注意力层的输入以及自注意力层的查询向量中。随后，我们评估了不同认知信号组合在多种关键词提取模型上的效果。结果表明，阅读过程中产生的认知信号能够持续提升关键词提取性能，无论特征组合和模型架构如何。脑电图特征带来的增益最大，而结合脑电图与眼动追踪特征的性能介于两种单独信号类型之间，这表明两者部分互补，但也可能存在冗余或噪声。这些发现表明，脑电图信号为基于微博的关键词提取提供了有用的认知证据，多模态认知信号值得进一步研究。

查看原文

查看缓存全文

缓存时间: 2026/06/26 05:16

# 利用人类阅读过程中产生的认知信号提升微博关键短语提取
来源：https://arxiv.org/abs/2606.26485
查看PDF（https://arxiv.org/pdf/2606.26485）

> 摘要：微博平台产生了大量简短、嘈杂且分散的用户内容，使得自动关键短语提取（AKE）成为一项重要但具有挑战性的任务。先前的研究利用眼动追踪信号来改进基于微博的AKE，因为这类信号能反映读者对显著词汇的注意力。然而，仅靠眼动追踪受限于生理、采集和特征解码等方面的约束。为解决此问题，我们探究了脑电图（EEG）信号是否能够补充眼动追踪信号以用于AKE。利用ZuCo认知语言处理语料库，我们选取了8个EEG特征和17个眼动追踪特征，并将其融入基于微博的AKE模型中。为减少模型结构可能对认知信号造成的扭曲，我们将这些特征注入软注意力层的输入以及自注意力层的查询向量中。随后，我们评估了不同认知信号组合在AKE模型上的表现。结果表明，阅读过程中产生的认知信号能持续提升AKE性能，无论特征组合与模型架构如何。EEG特征带来的增益最大，而结合EEG与眼动追踪特征的效果介于两者单独使用之间，表明两者部分互补，但也可能存在冗余或噪声。这些发现表明，EEG信号为基于微博的AKE提供了有价值的认知证据，多模态认知信号值得进一步研究。

## 提交历史

来自：Chengzhi Zhang \[查看电子邮件（https://arxiv.org/show-email/05c2844d/2606.26485）\] **\[v1\]** 2026年6月25日星期四 00:43:12 UTC（1,696 KB）

Attention Expansion: Enhancing Keyphrase Extraction from Long Documents with Attention-Augmented Contextualized Embeddings

arXiv cs.CL

本文提出了一种注意力扩展机制，通过使用上下文外信息增强PLM token表示，提升长文档的关键词提取性能，在不需全文档注意力或昂贵LLM推理的情况下，持续优于最先进模型。

通过稀疏自编码器实现脑电图基础模型的机制可解释性

arXiv cs.LG

本文对三个脑电图基础模型（SleepFM、REVE、LaBraM）应用TopK稀疏自编码器，提取可解释的特征字典，并引入了概念引导框架，揭示了表征失败和临床纠缠问题。

利用人类阅读时产生的认知信号增强微博关键词提取

相似文章

Meta改进了Brain2QWERTY，这是一个通过非侵入式技术MEG和EEG解码大脑活动以实现打字输入的系统

Brain-CLIPLM：基于脑电压缩语义表征的语言重建解码

评估区域级脑电图对认知负荷预测的贡献

Attention Expansion: Enhancing Keyphrase Extraction from Long Documents with Attention-Augmented Contextualized Embeddings

通过稀疏自编码器实现脑电图基础模型的机制可解释性

提交意见反馈