Sajjo/hindi_dataset
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Sajjo/hindi_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和句子两种特征,数据类型分别为音频和字符串。数据集分为训练集、验证集和测试集,其中训练集包含105,339个示例,验证集包含5,852个示例,测试集包含5,853个示例。数据集的下载大小为6,993,692,265字节,总大小为7,359,592,521.202字节。配置信息指定了每个分割的数据文件路径。
The dataset contains two features: audio and sentence, with data types of audio and string, respectively. The dataset is divided into training, validation, and test sets, with the training set containing 105,339 examples, the validation set containing 5,852 examples, and the test set containing 5,853 examples. The download size of the dataset is 6,993,692,265 bytes, and the total size is 7,359,592,521.202 bytes. Configuration information specifies the data file paths for each split.
提供机构:
Sajjo
原始信息汇总
数据集概述
数据集信息
- 特征:
audio: 音频数据,数据类型为audio。sentence: 文本数据,数据类型为string。
数据集划分
- 训练集:
- 文件大小: 6612523512.808267 字节
- 样本数量: 105339
- 验证集:
- 文件大小: 374902427.8634223 字节
- 样本数量: 5852
- 测试集:
- 文件大小: 372166580.5303108 字节
- 样本数量: 5853
数据集大小
- 下载大小: 6993692265 字节
- 总大小: 7359592521.202 字节
配置信息
- 配置名称:
default - 数据文件路径:
- 训练集:
data/train-* - 验证集:
data/valid-* - 测试集:
data/test-*
- 训练集:



