surindersinghssj/gurbani-kirtan-first-pilot500-train
收藏Hugging Face2026-04-09 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/surindersinghssj/gurbani-kirtan-first-pilot500-train
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: transcription
dtype: string
- name: duration_sec
dtype: float64
- name: source_dataset
dtype: string
splits:
- name: train
num_bytes: 4235741152.0
num_examples: 15694
- name: validation
num_bytes: 40798678.0
num_examples: 300
download_size: 4258845896
dataset_size: 4276539830.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息:
## 数据特征
1. 音频(audio):数据类型为音频格式,采样率为16000赫兹
2. 转录文本(transcription):数据类型为字符串
3. 时长(duration_sec):单位为秒,数据类型为64位浮点数(float64)
4. 源数据集(source_dataset):数据类型为字符串
## 数据划分
1. 训练集(train):占用字节数为4235741152.0,样本数量为15694
2. 验证集(validation):占用字节数为40798678.0,样本数量为300
## 全局参数
- 下载大小:4258845896字节
- 数据集总大小:4276539830.0字节
## 配置信息
- 默认配置(default):数据文件映射关系如下:
- 训练集:`data/train-*`
- 验证集:`data/validation-*`
提供机构:
surindersinghssj



