标签
本文提出了一种新颖的说话人确认框架,该框架结合了冻结的自监督特征、ECAPA-TDNN和专家混合模块,通过条件蒸馏和对比损失来改进语音和非语言发声中的身份确认,同时防止灾难性遗忘。
本文提出了一种利用干预对比学习的后训练优化方法,将语音基础模型的表示解耦为独立的内容和说话人子空间。该方法在域外说话人验证任务上表现出更优性能,并提供了成功分离的证据。