标签
Speech Playground 是一款语音分析与比对的交互工具,结合 Python 后端与 Web 前端,支持多种特征类型探索以及话语对比,适用于语音研究和计算机辅助发音训练。
本文提出了一种多视图门控图注意力网络,用于从自发言语中检测阿尔茨海默病,利用语义图、依存图和共现图,并采用自适应门控融合机制。该模型在ADReSSo数据集上达到90.00%的准确率,源代码已公开。
本文提出一个多阶段可解释框架,结合基于SHAP的词元归因、理论指导的语言特征以及LLaMA-3.1-70B-Instruct大语言模型推理,用于解释基于Transformer的语音模型在认知障碍检测中的表现,取得了良好的临床一致性及高可用性评分。
本文探讨了老年人的日常语言是否可以用作个性化的认知监测工具,发现AI模型能够检测出表明认知衰退的微妙语言模式,而标准的GPT回答则无法做到这一点。
提出了一种多模态框架,用于从语音中公平地检测轻度认知障碍,通过梯度反转实现遗忘,以减少人口统计学偏差并提升各子群体的性能。
本文介绍了MA-DLE,一种基于记忆的特征增强方法,用于基于语音的自动抑郁程度评估,在DAIC-WOZ和E-DAIC数据集上达到了最先进的性能。
本文提出了一种跨语言迁移学习方法,用于从语音中检测阿尔茨海默病,覆盖多种语言,实现了82%的F1分数,并支持实时筛查应用。
这篇学术论文探讨了利用大语言模型(LLMs)从零样本预测自发语音中的心理健康评分,评估了12个模型,并实现了与临床指标的高度相关性。