five

spktsagar/openslr-nepali-asr-cleaned

收藏
Hugging Face2022-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/spktsagar/openslr-nepali-asr-cleaned
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含尼泊尔语的转录音频数据,音频文件为flac格式,并附带一个TSV文件。数据集经过手动质量检查,但仍可能存在错误。音频文件的采样率为16KHz,并使用torchaudio的语音活动检测功能去除前后静音。数据集支持自动语音识别任务,语言为尼泊尔语。数据集结构包括数据实例、数据字段和数据分割信息。
提供机构:
spktsagar
原始信息汇总

数据集概述

数据集配置

  • original: 原始数据配置
  • cleaned: 预处理数据配置

数据集特征

  • utterance_id: 字符串类型,标识语音记录
  • speaker_id: 字符串类型,标识说话者
  • utterance: 音频特征,采样率为16000Hz
  • transcription: 字符串类型,语音转录文本
  • num_frames: 整数类型,波形数组长度

数据集分割

  • train: 训练集
    • 数据大小: 40925646字节
    • 示例数量: 157905

下载信息

  • original配置下载大小: 9340083067字节
  • cleaned配置下载大小: 5978669282字节

数据集语言

  • Nepali: 尼泊尔语

数据集用途

  • automatic-speech-recognition: 用于自动语音识别模型的训练
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作