awajai/phase2dataset-stt
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/awajai/phase2dataset-stt
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频、转录、输入长度、输入特征、标签和标签长度等特征。数据集分为训练集,包含5056个样本,总大小为5433748133.1572075字节。下载大小为1319587275字节。配置信息中指定了默认配置的数据文件路径。
提供机构:
awajai
原始信息汇总
数据集概述
数据集特征
- audio:
- 采样率: 16000
- transcription:
- 数据类型: string
- input_length:
- 数据类型: int64
- input_features:
- 序列类型: float32
- labels:
- 序列类型: int64
- labels_length:
- 数据类型: int64
数据集分割
- train:
- 字节数: 5433748133.1572075
- 样本数: 5056
数据集大小
- 下载大小: 1319587275
- 数据集总大小: 5433748133.1572075
配置
- config_name: default
- 数据文件路径: data/train-*



