tobiolatunji/afrispeech-200

Name: tobiolatunji/afrispeech-200
Creator: tobiolatunji
Published: 2023-11-20 09:20:34
License: 暂无描述

Hugging Face2023-11-20 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/tobiolatunji/afrispeech-200

下载链接

链接失效反馈

官方服务：

资源简介：

AFRISPEECH-200是一个包含200小时泛非洲口音英语语音的数据集，用于临床和通用领域的自动语音识别（ASR）研究。该数据集由来自13个国家的2,463名独特说话者录制，涵盖120种非洲口音。数据集的创建旨在提高对泛非洲英语ASR研究的认识，特别是在临床领域。

提供机构：

tobiolatunji

原始信息汇总

数据集概述

数据实例: 每个数据点包含音频文件路径（path）及其转录文本（transcript）
数据字段:
- user_id: 字符串类型
- path: 字符串类型
- audio: 音频类型，采样率为44100
- transcript: 字符串类型
数据分割:
- train: 58000个样本，1722002133字节
- dev: 3231个样本，86120227字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集