利用人类阅读时产生的认知信号增强微博关键词提取
摘要
本文研究了脑电图信号能否补充眼动追踪信号用于微博的自动关键词提取。使用ZuCo语料库,作者表明认知信号,特别是脑电图信号,在不同模型上均能提升自动关键词提取的性能。
arXiv:2606.26485v1 公告类型:新
摘要:微博平台产生了大量简短、嘈杂且分散的用户内容,使得自动关键词提取成为一项重要但具有挑战性的任务。以往研究利用眼动追踪信号来改善基于微博的关键词提取,因为此类信号反映了读者对显著词汇的关注。然而,仅凭眼动追踪受到生理、采集和特征解码方面的限制。针对这一问题,我们研究了脑电图信号能否补充眼动追踪信号用于关键词提取。使用ZuCo认知语言处理语料库,我们选取了8个脑电图特征和17个眼动追踪特征,并将其融入基于微博的关键词提取模型中。为减少模型结构对认知信号可能造成的扭曲,我们将这些特征注入到软注意力层的输入以及自注意力层的查询向量中。随后,我们评估了不同认知信号组合在多种关键词提取模型上的效果。结果表明,阅读过程中产生的认知信号能够持续提升关键词提取性能,无论特征组合和模型架构如何。脑电图特征带来的增益最大,而结合脑电图与眼动追踪特征的性能介于两种单独信号类型之间,这表明两者部分互补,但也可能存在冗余或噪声。这些发现表明,脑电图信号为基于微博的关键词提取提供了有用的认知证据,多模态认知信号值得进一步研究。
查看缓存全文
缓存时间: 2026/06/26 05:16
# 利用人类阅读过程中产生的认知信号提升微博关键短语提取 来源:https://arxiv.org/abs/2606.26485 查看PDF(https://arxiv.org/pdf/2606.26485) > 摘要:微博平台产生了大量简短、嘈杂且分散的用户内容,使得自动关键短语提取(AKE)成为一项重要但具有挑战性的任务。先前的研究利用眼动追踪信号来改进基于微博的AKE,因为这类信号能反映读者对显著词汇的注意力。然而,仅靠眼动追踪受限于生理、采集和特征解码等方面的约束。为解决此问题,我们探究了脑电图(EEG)信号是否能够补充眼动追踪信号以用于AKE。利用ZuCo认知语言处理语料库,我们选取了8个EEG特征和17个眼动追踪特征,并将其融入基于微博的AKE模型中。为减少模型结构可能对认知信号造成的扭曲,我们将这些特征注入软注意力层的输入以及自注意力层的查询向量中。随后,我们评估了不同认知信号组合在AKE模型上的表现。结果表明,阅读过程中产生的认知信号能持续提升AKE性能,无论特征组合与模型架构如何。EEG特征带来的增益最大,而结合EEG与眼动追踪特征的效果介于两者单独使用之间,表明两者部分互补,但也可能存在冗余或噪声。这些发现表明,EEG信号为基于微博的AKE提供了有价值的认知证据,多模态认知信号值得进一步研究。 ## 提交历史 来自:Chengzhi Zhang \[查看电子邮件(https://arxiv.org/show-email/05c2844d/2606.26485)\] **\[v1\]** 2026年6月25日星期四 00:43:12 UTC(1,696 KB)
相似文章
Meta改进了Brain2QWERTY,这是一个通过非侵入式技术MEG和EEG解码大脑活动以实现打字输入的系统
Meta改进了Brain2QWERTY,这是一个使用MEG和EEG的非侵入式系统,可将大脑活动解码为文本,实现打字
Brain-CLIPLM:基于脑电压缩语义表征的语言重建解码
研究人员提出Brain-CLIPLM,一个两阶段脑电到文本解码框架,利用对比学习提取语义锚点,并结合基于检索的大语言模型(LLM)及思维链(CoT)推理进行句子重建。该方法在测试中达到67.55%的Top-5句子检索准确率和85.00%的Top-25准确率,显著优于直接解码基线模型,跨被试评估证实了其良好的泛化能力。研究结果表明,脑电到文本解码应聚焦于恢复压缩后的语义内容,而非完整句子重建。
评估区域级脑电图对认知负荷预测的贡献
本文提出了一种基于脑电图的认知负荷预测的区域级评估框架,表明额叶电极组在使用较少电极的情况下,在排名位置上比全头皮基线高出15-20%,支持高效的工作负荷监测系统。
Attention Expansion: Enhancing Keyphrase Extraction from Long Documents with Attention-Augmented Contextualized Embeddings
本文提出了一种注意力扩展机制,通过使用上下文外信息增强PLM token表示,提升长文档的关键词提取性能,在不需全文档注意力或昂贵LLM推理的情况下,持续优于最先进模型。
通过稀疏自编码器实现脑电图基础模型的机制可解释性
本文对三个脑电图基础模型(SleepFM、REVE、LaBraM)应用TopK稀疏自编码器,提取可解释的特征字典,并引入了概念引导框架,揭示了表征失败和临床纠缠问题。