five

Mozilla Common Voice, FLEURS, BDU-speech dataset|语音识别数据集|低资源语言数据集

收藏
arXiv2025-03-24 更新2025-03-26 收录
语音识别
低资源语言
下载链接:
https://huggingface.co/datasets/mozilla-foundation/common_voice_17_0, https://huggingface.co/datasets/google/fleurs, https://figshare.com/articles/dataset/Yohannes_A_Ejigu_Amharic_ASR_Dataset_zip/24959727
下载链接
链接失效反馈
资源简介:
本文介绍了用于自动语音识别的低资源语言Amharic的三个数据集:Mozilla Common Voice、FLEURS和BDU-speech dataset。Mozilla Common Voice是一个包含多种语言的语音语料库,FLEURS是一个针对低资源语言的语音数据集,BDU-speech dataset则是包含Amharic语言的噪声语音数据集。这些数据集为改善Amharic自动语音识别模型的性能提供了基础数据。
提供机构:
Wollo University, Bahir Dar University, Universität Hamburg, Bayero University, Kano
创建时间:
2025-03-24
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集