zainulhakim/us_dataset
收藏Hugging Face2024-06-09 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/zainulhakim/us_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本两种数据类型,音频的采样率为16000Hz,文本为字符串类型。数据集分为四个部分:训练集(train)、验证集(validation)、测试集(test)和全局测试集(global_test)。训练集包含79个样本,验证集包含9个样本,测试集包含11个样本,全局测试集包含44个样本。数据集的下载大小为45228918字节,总大小为45817363字节。
该数据集包含音频和文本两种数据类型,音频的采样率为16000Hz,文本为字符串类型。数据集分为四个部分:训练集(train)、验证集(validation)、测试集(test)和全局测试集(global_test)。训练集包含79个样本,验证集包含9个样本,测试集包含11个样本,全局测试集包含44个样本。数据集的下载大小为45228918字节,总大小为45817363字节。
提供机构:
zainulhakim
原始信息汇总
数据集概述
特征
- audio: 音频数据,采样率为16000。
- text: 文本数据,数据类型为字符串。
数据集划分
- train: 训练集,包含79个样本,占用25311689.0字节。
- validation: 验证集,包含9个样本,占用2883611.0字节。
- test: 测试集,包含11个样本,占用3524413.0字节。
- global_test: 全局测试集,包含44个样本,占用14097650.0字节。
数据集大小
- 下载大小: 45228918字节
- 数据集总大小: 45817363.0字节
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- global_test: data/global_test-*
- data_files:



