spktsagar/openslr-nepali-asr-cleaned
收藏Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/spktsagar/openslr-nepali-asr-cleaned
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含尼泊尔语的转录音频数据,音频文件为flac格式,并附带一个TSV文件。数据集经过手动质量检查,但仍可能存在错误。音频文件的采样率为16KHz,并使用torchaudio的语音活动检测功能去除前后静音。数据集支持自动语音识别任务,语言为尼泊尔语。数据集结构包括数据实例、数据字段和数据分割信息。
提供机构:
spktsagar
原始信息汇总
数据集概述
数据集配置
- original: 原始数据配置
- cleaned: 预处理数据配置
数据集特征
- utterance_id: 字符串类型,标识语音记录
- speaker_id: 字符串类型,标识说话者
- utterance: 音频特征,采样率为16000Hz
- transcription: 字符串类型,语音转录文本
- num_frames: 整数类型,波形数组长度
数据集分割
- train: 训练集
- 数据大小: 40925646字节
- 示例数量: 157905
下载信息
- original配置下载大小: 9340083067字节
- cleaned配置下载大小: 5978669282字节
数据集语言
- Nepali: 尼泊尔语
数据集用途
- automatic-speech-recognition: 用于自动语音识别模型的训练



