spktsagar/openslr-nepali-asr-cleaned

Name: spktsagar/openslr-nepali-asr-cleaned
Creator: spktsagar
Published: 2022-10-23 18:15:15
License: 暂无描述

Hugging Face2022-10-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/spktsagar/openslr-nepali-asr-cleaned

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含尼泊尔语的转录音频数据，音频文件为flac格式，并附带一个TSV文件。数据集经过手动质量检查，但仍可能存在错误。音频文件的采样率为16KHz，并使用torchaudio的语音活动检测功能去除前后静音。数据集支持自动语音识别任务，语言为尼泊尔语。数据集结构包括数据实例、数据字段和数据分割信息。

提供机构：

spktsagar

原始信息汇总

数据集概述

数据集配置

original: 原始数据配置
cleaned: 预处理数据配置

数据集特征

utterance_id: 字符串类型，标识语音记录
speaker_id: 字符串类型，标识说话者
utterance: 音频特征，采样率为16000Hz
transcription: 字符串类型，语音转录文本
num_frames: 整数类型，波形数组长度

数据集分割

train: 训练集
- 数据大小: 40925646字节
- 示例数量: 157905

下载信息

original配置下载大小: 9340083067字节
cleaned配置下载大小: 5978669282字节

数据集语言

Nepali: 尼泊尔语

数据集用途

automatic-speech-recognition: 用于自动语音识别模型的训练

5,000+

优质数据集

54 个

任务类型

进入经典数据集