five

M9and2M/Wolof_ASR_dataset

收藏
Hugging Face2024-07-02 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/M9and2M/Wolof_ASR_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个Wolof语音数据集,包含多个来源的语音数据,格式为WAV或MP3,并附有相应的转录文本、音频时长、文件名和路径信息。数据集来源于Hugging Face和其他网站资源,如ALFFA、WAXAL和WOLOF TTS数据集。每个数据集都有详细的来源链接和处理说明。

This dataset is a collection of Wolof speech data from various sources, each stored in separate pickle files. Each pickle file contains audio data in WAV or MP3 format, corresponding transcriptions, audio length, filename, and path to the audio file. The sources of the dataset include Hugging Face and other websites such as ISMA/ALFFA_WOLOF, PERRYNELSON/WAXAL-WOLOF, GOOGLE/FLEURS, etc.
提供机构:
M9and2M
原始信息汇总

Wolof Speech Dataset

概述

该数据集包含多个Wolof语音数据集,每个数据集存储在单独的pickle文件中。每个pickle文件包含以下列:

  • audio: 音频数据,格式为WAV或MP3。
  • transcription: 音频数据的对应转录文本。
  • length(duration(s)): 每个音频录音的时长。
  • filename: 音频文件的名称。
  • path: 音频文件的路径。

数据集来源

Hugging Face来源

  1. ISMA/ALFFA_WOLOF

    • 来源: https://huggingface.co/datasets/Isma/alffa_wolof
    • 处理: 创建了一个函数从列中提取音频并保存为WAV文件。
  2. PERRYNELSON/WAXAL-WOLOF

    • 来源: https://huggingface.co/datasets/perrynelson/waxal-wolof
  3. GOOGLE/FLEURS

    • 来源: https://huggingface.co/datasets/google/fleurs/viewer/wo_sn

其他网站来源

  1. ALFFA DATASET

    • 作者: Gauthier, Elodie ; Besacier, Laurent ; Voisin, Sylvie ; Melese, Michael ; Elingui, Uriel Pascal
    • 标题: Collecting Resources in Sub-Saharan African Languages for Automatic Speech Recognition: a Case Study of Wolof
    • 链接: https://aclanthology.org/L16-1611/
  2. WAXAL DATASET

    • 作者: Waxal-Multilingual
    • 标题: Waxal Speech Data Resources
    • 链接: https://github.com/Waxal-Multilingual/speech-data/tree/main
  3. WOLOF TTS DATASET

    • 作者: Diop, Thierno Ibrahima ; Aw, Demba; Jaane, Ami; Badiane, Mamadou
    • 标题: WOLOF TTS(Text To Speech) Data
    • 链接: https://zenodo.org/records/4498861#.YXU2A3X7R-M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作