zainulhakim/arabs_dataset
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/zainulhakim/arabs_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本两种特征,音频采样率为16000Hz,文本为字符串类型。数据集分为训练集、验证集、测试集和全局测试集,每个部分有相应的样本数量和字节数。总下载大小为45158268字节,总数据集大小为45817363.0字节。
该数据集包含音频和文本两种特征,音频采样率为16000Hz,文本为字符串类型。数据集分为训练集、验证集、测试集和全局测试集,每个部分有相应的样本数量和字节数。总下载大小为45158268字节,总数据集大小为45817363.0字节。
提供机构:
zainulhakim
原始信息汇总
数据集概述
特征
- audio:
- 采样率: 16000
- text:
- 数据类型: string
数据分割
- train:
- 字节数: 25311689.0
- 样本数: 79
- validation:
- 字节数: 2883611.0
- 样本数: 9
- test:
- 字节数: 3524413.0
- 样本数: 11
- global_test:
- 字节数: 14097650.0
- 样本数: 44
数据集大小
- 下载大小: 45158268
- 数据集总大小: 45817363.0
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- global_test: data/global_test-*
- data_files:



