maxseats/aihub-464-preprocessed-680GB-set-32
收藏Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/maxseats/aihub-464-preprocessed-680GB-set-32
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、标签和输入特征三个主要特征。音频特征的采样率为16000Hz,标签为字符串类型,输入特征为浮点数序列。数据集分为训练集、测试集和验证集,分别包含42553、5320和5319个样本。数据集的下载大小为22098366053字节,总大小为61735194121.99999字节。配置信息指定了每个分割对应的数据文件路径。
The dataset includes audio data, labels, and input features. The audio data has a sampling rate of 16000Hz, labels are of string type, and input features are sequences of float32. The dataset is divided into train, test, and valid sets, containing 42553, 5320, and 5319 examples respectively. The total download size of the dataset is 22098366053 bytes, and the total size is 61735194121.99999 bytes.
提供机构:
maxseats
原始信息汇总
数据集概述
数据特征
- 音频
- 采样率: 16000 Hz
- 标签
- 数据类型: 字符串
- 输入特征
- 序列类型: float32
数据分割
- 训练集
- 字节数: 49387458931.29542
- 样本数: 42553
- 测试集
- 字节数: 6174447900.606106
- 样本数: 5320
- 验证集
- 字节数: 6173287290.098474
- 样本数: 5319
数据大小
- 下载大小: 22098366053 字节
- 数据集大小: 61735194121.99999 字节
配置
- 默认配置
- 数据文件路径:
- 训练集: data/train-*
- 测试集: data/test-*
- 验证集: data/valid-*
- 数据文件路径:



