Mozilla Common Voice, FLEURS, BDU-speech dataset|语音识别数据集|低资源语言数据集
收藏arXiv2025-03-24 更新2025-03-26 收录
下载链接:
https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0, https://huggingface.co/datasets/google/fleurs, https://figshare.com/articles/dataset/Yohannes_A_Ejigu_Amharic_ASR_Dataset_zip/24959727
下载链接
链接失效反馈资源简介:
本文介绍了用于自动语音识别的低资源语言Amharic的三个数据集:Mozilla Common Voice、FLEURS和BDU-speech dataset。Mozilla Common Voice是一个包含多种语言的语音语料库,FLEURS是一个针对低资源语言的语音数据集,BDU-speech dataset则是包含Amharic语言的噪声语音数据集。这些数据集为改善Amharic自动语音识别模型的性能提供了基础数据。
提供机构:
Wollo University, Bahir Dar University, Universität Hamburg, Bayero University, Kano
创建时间:
2025-03-24
