cpalenmichel/kmr-bible
收藏Hugging Face2023-12-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cpalenmichel/kmr-bible
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: path
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
splits:
- name: train
num_bytes: 2149151663.368
num_examples: 2754
- name: test
num_bytes: 241863045.0
num_examples: 327
- name: valid
num_bytes: 255423909.0
num_examples: 334
download_size: 2545514213
dataset_size: 2646438617.368
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: valid
path: data/valid-*
---
数据集信息(dataset_info):
特征字段:
- 字段名:文本(text),数据类型:字符串(string)
- 字段名:路径(path),数据类型:字符串(string)
- 字段名:音频(audio),数据类型为音频格式,采样率(sampling_rate)为16000 Hz
数据集划分:
- 划分名称:训练集(train),占用字节数:2149151663.368,样本数量:2754
- 划分名称:测试集(test),占用字节数:241863045.0,样本数量:327
- 划分名称:验证集(valid),占用字节数:255423909.0,样本数量:334
下载总大小:2545514213 字节
数据集总占用大小:2646438617.368 字节
数据集配置:
- 配置名称:默认配置(default),数据文件路径:
- 训练集划分对应路径:data/train-*
- 测试集划分对应路径:data/test-*
- 验证集划分对应路径:data/valid-*
提供机构:
cpalenmichel
原始信息汇总
数据集概述
数据特征
- text: 数据类型为字符串。
- path: 数据类型为字符串。
- audio: 包含音频数据,采样率为16000。
数据分割
- train: 包含2754个样本,总字节数为2149151663.368。
- test: 包含327个样本,总字节数为241863045.0。
- valid: 包含334个样本,总字节数为255423909.0。
数据大小
- 下载大小: 2545514213字节。
- 数据集大小: 2646438617.368字节。
配置
- default:
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。 - valid: 数据路径为
data/valid-*。
- train: 数据路径为



