M9and2M/Wolof_ASR_dataset
收藏Hugging Face2024-07-02 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/M9and2M/Wolof_ASR_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个Wolof语音数据集,包含多个来源的语音数据,格式为WAV或MP3,并附有相应的转录文本、音频时长、文件名和路径信息。数据集来源于Hugging Face和其他网站资源,如ALFFA、WAXAL和WOLOF TTS数据集。每个数据集都有详细的来源链接和处理说明。
This dataset is a collection of Wolof speech data from various sources, each stored in separate pickle files. Each pickle file contains audio data in WAV or MP3 format, corresponding transcriptions, audio length, filename, and path to the audio file. The sources of the dataset include Hugging Face and other websites such as ISMA/ALFFA_WOLOF, PERRYNELSON/WAXAL-WOLOF, GOOGLE/FLEURS, etc.
提供机构:
M9and2M
原始信息汇总
Wolof Speech Dataset
概述
该数据集包含多个Wolof语音数据集,每个数据集存储在单独的pickle文件中。每个pickle文件包含以下列:
- audio: 音频数据,格式为WAV或MP3。
- transcription: 音频数据的对应转录文本。
- length(duration(s)): 每个音频录音的时长。
- filename: 音频文件的名称。
- path: 音频文件的路径。
数据集来源
Hugging Face来源
-
ISMA/ALFFA_WOLOF
- 来源: https://huggingface.co/datasets/Isma/alffa_wolof
- 处理: 创建了一个函数从列中提取音频并保存为WAV文件。
-
PERRYNELSON/WAXAL-WOLOF
- 来源: https://huggingface.co/datasets/perrynelson/waxal-wolof
-
GOOGLE/FLEURS
- 来源: https://huggingface.co/datasets/google/fleurs/viewer/wo_sn
其他网站来源
-
ALFFA DATASET
- 作者: Gauthier, Elodie ; Besacier, Laurent ; Voisin, Sylvie ; Melese, Michael ; Elingui, Uriel Pascal
- 标题: Collecting Resources in Sub-Saharan African Languages for Automatic Speech Recognition: a Case Study of Wolof
- 链接: https://aclanthology.org/L16-1611/
-
WAXAL DATASET
- 作者: Waxal-Multilingual
- 标题: Waxal Speech Data Resources
- 链接: https://github.com/Waxal-Multilingual/speech-data/tree/main
-
WOLOF TTS DATASET
- 作者: Diop, Thierno Ibrahima ; Aw, Demba; Jaane, Ami; Badiane, Mamadou
- 标题: WOLOF TTS(Text To Speech) Data
- 链接: https://zenodo.org/records/4498861#.YXU2A3X7R-M



