标签
PRISM是一个新颖的跨被试脑电图情绪识别框架,它通过轻量级专家集成实现优先级通道重要性加权,并结合使用置信度过滤伪标签的半监督领域适应,在DEAP、DREAMER和SEED数据集上取得了最先进的结果。
本文介绍了一种混合框架,用于歌词的句子级情感标注,通过预测不对齐来优化人与LLM的协作,解决了歌词情感识别中的主观性和可扩展性挑战。
本文评估了十二种最新文本编码器在三种心理学情绪理论中编码情感线索的能力,发现指令感知的开源权重编码器在单词级别上达到或超过专有编码器,而任务微调嵌入在句子级别上更优。
本文研究使用基于Transformer的生成模型从日本演员的动作捕捉数据中学习情感身体运动,生成基于离散情感标签的运动。评估表明,生成的运动在用于数据增强时能提升情感识别性能,并实现情感强度间的平滑过渡。
本文提出了NEST-V1,一个用于从语音输入生成情感条件尼泊尔手语虚拟形象的概念验证多模态框架,在包含50名说话者600个音频样本的数据集上实现了81.1%的ASR准确率和79.21%的情感识别准确率。
本文评估了深度学习模型(LSTM、TCN、Transformer)在WESAD数据集上基于生理信号的多模态情感识别表现,结果表明集成方法达到了98.91%的准确率。
RECTOR 是一个自监督框架,从 EEG/sEEG 信号中学习联合的区域-通道-时间表征,用于情感和认知状态分类,在情绪识别和任务参与度基准测试中取得了最先进的结果。
PRISM 是一个多智能体框架,通过将语音感知、响应生成和语音合成解耦,并结合韵律线索与大语言模型推理及外部知识工具,以提升共情口语对话的质量。
SHALA-LLM是一个强化学习框架,使大语言模型能够直接从标注者分布中学习,并在对齐过程中动态优先处理高模糊样本,从而提升与人类标签分布的一致性及分类性能。
本文介绍了用于手语对话情感识别的eJSL Dialog数据集,填补了现有数据集缺乏对话上下文的空白。基准测试表明,应用通用多模态模型时存在领域差距,凸显了针对手语的上下文感知视觉提取器的必要性。
本文介绍了一个用于主动对话智能体的多模态情绪识别模块,该模块结合了面部识别与语言分析。一项涉及20名参与者的用户研究发现了一种“扑克脸”效应,即视觉线索不可靠,而语言分析则更为准确;研究还表明,智能体可以通过对话适应性来引发情绪。
本文提出了一种基于自定进度课程学习的即插即用模块,用于增强多模态对话情感识别中的模态平衡,在IEMOCAP和MELD数据集上实现了F1分数的一致提升。
本文提出了一种轻量级框架,使用粘性因子HDP-HMM从多模态效价-唤醒轨迹中建模会话情绪为潜在状态,旨在实现可解释且计算高效的情绪状态跟踪。
本文介绍了 EmoS,这是一个专为细粒度流式情感理解设计的高保真多模态基准,旨在解决现有数据集中存在的生态效度不足和标注可靠性低的问题。
本研究论文考察了大语言模型表达社会情感的方式与人类文化规范的匹配度,发现两者存在系统性错位。与人类回应相比,大语言模型在不同文化身份(欧美裔美国人与拉美裔美国人)下表现出的参与型与抽离型情感表达模式不一致。