maxseats/aihub-464-preprocessed-680GB-set-40
收藏Hugging Face2024-07-05 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/maxseats/aihub-464-preprocessed-680GB-set-40
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、标签和输入特征三个主要特征。音频特征的采样率为16000Hz,标签特征为字符串类型,输入特征为浮点数序列。数据集分为训练集、测试集和验证集,分别包含44170、5522和5521个样本。数据集的总下载大小为21941784881字节,总数据集大小为63638831540.0字节。
This dataset includes three main features: audio, labels, and input features. The audio feature has a sampling rate of 16000Hz, the labels feature is of string type, and the input features are sequences of float32. The dataset is divided into train, test, and valid splits, containing 44170, 5522, and 5521 examples respectively. The total download size of the dataset is 21941784881 bytes, and the total dataset size is 63638831540.0 bytes.
提供机构:
maxseats
原始信息汇总
数据集概述
数据特征
- 音频
- 采样率: 16000
- 标签
- 数据类型: 字符串
- 输入特征
- 序列类型: 浮点数 (float32)
数据划分
- 训练集
- 样本数量: 44170
- 数据大小: 50910604189.62563 字节
- 测试集
- 样本数量: 5522
- 数据大小: 6364689978.155145 字节
- 验证集
- 样本数量: 5521
- 数据大小: 6363537372.219224 字节
数据集大小
- 下载大小: 21941784881 字节
- 总数据大小: 63638831540.0 字节
配置
- 默认配置
- 训练集路径: data/train-*
- 测试集路径: data/test-*
- 验证集路径: data/valid-*



