Tadabur:大规模《古兰经》音频数据集
摘要
Tadabur 是一个包含 1,400 多小时《古兰经》朗诵音频的数据集,汇集 600 多位诵读者,旨在推动《古兰经》语音研究与基准测试。
查看缓存全文
缓存时间: 2026/04/23 11:54
论文页面 - Tadabur:大规模《古兰经》音频数据集
来源:https://huggingface.co/papers/2604.18932
摘要
尽管《古兰经》数据研究日益受到关注,但现有数据集在规模和多样性方面仍显不足。为此,我们推出 Tadabur——一个大规模《古兰经》朗读音频数据集。Tadabur 收录 1400+ 小时诵读音频,涵盖 600+ 位不同诵读者,在朗读风格、嗓音特征与录音环境上提供丰富变化。这种多样性使其成为《古兰经》语音研究与分析的全面且具代表性的资源。通过大幅扩展可用《古兰经》数据的总量与多样性,Tadabur 旨在支持未来研究,并推动标准化《古兰经》语音基准的建立。
查看 arXiv 页面(https://arxiv.org/abs/2604.18932)
查看 PDF(https://arxiv.org/pdf/2604.18932)
项目主页(https://fherran.github.io/tadabur/)
GitHub112(https://github.com/fherran/tadabur)
添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2604.18932)
在智能体中获取该论文:
hf papers read 2604.18932
尚未安装最新 CLI?
curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型 0
暂无模型关联该论文
在模型 README.md 中引用 arxiv.org/abs/2604.18932 即可在此页面显示链接。
引用该论文的数据集 1
FaisaI/tadabur Viewer • 约 22 小时前更新 • 409k • 3.84k • 13(https://huggingface.co/datasets/FaisaI/tadabur)
引用该论文的 Spaces 0
暂无 Space 关联该论文
在 Space README.md 中引用 arxiv.org/abs/2604.18932 即可在此页面显示链接。
收录该论文的 Collections 0
暂无 Collection 收录该论文
将该论文添加到收藏(https://huggingface.co/new-collection)即可在此页面显示链接。
相似文章
针对《古兰经》语音识别的预训练Transformer模型比较研究:语音表示、标签格式与数据集构成
本文系统性地实证研究了针对《古兰经》自动语音识别(ASR)的预训练Transformer模型(Wav2Vec2.0、HuBERT、XLS-R)微调,在EveryAyah子集上实现了0.08的词错误率(WER),并将训练时间从140小时减少到40小时,其中Wav2Vec2-XLSR-53提供了最佳表示。
MUSCAT:多语言科学对话基准
MUSCAT是一个新的多语言科学对话基准数据集,用于评估ASR系统在具有挑战性的多语言场景中的表现,包括代码混合、特定领域词汇和混合语言输入。该数据集包含使用不同语言的说话者之间关于科学论文的双语讨论,结果表明当前的最先进系统在应对这些多语言挑战时存在困难。
面向低资源语言的文本去毒化系统Tatoxa:以鞑靼语为例
介绍了Tatoxa,一个用于鞑靼语文本去毒化的最先进系统,优于现有的大语言模型。引入了一个新数据集,并表明跨语言迁移的效果比使用原生数据差。
TTS基准对比(截至2026年5月的所有已知TTS)
一个用户创建的用于比较本地TTS工具的基准测试,包含Windows和Mac的结果,Linux测试待完成。包含HTML结果页面和GitHub仓库。
文本转语音(TTS)基准测试更新:引入客观标准和盲投票(已涵盖46个模型,持续增加中)
更新后的TTS基准测试引入了客观标准和实时盲投票机制,为46+模型创建ELO排名,并向社区开放参与。