multilingual-asr

#multilingual-asr

Vividh-ASR：面向稳健印度语音识别的复杂度分层基准与优化动态

Hugging Face Daily Papers ↗ · 3天前缓存

介绍了用于印地语和马拉雅拉姆语ASR的复杂度分层基准Vividh-ASR，指出了微调中的录音室偏差，并提出了R-MFT以高效提升自发言语性能。

0 人收藏 0 人点赞

#multilingual-asr

arXiv cs.CL ↗ · 2026-04-20 缓存

MUSCAT是一个新的多语言科学对话基准数据集，用于评估ASR系统在具有挑战性的多语言场景中的表现，包括代码混合、特定领域词汇和混合语言输入。该数据集包含使用不同语言的说话者之间关于科学论文的双语讨论，结果表明当前的最先进系统在应对这些多语言挑战时存在困难。

0 人收藏 0 人点赞