awajai/augmented-dataset-part1-prepared-stt-v3
收藏Hugging Face2024-07-25 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/awajai/augmented-dataset-part1-prepared-stt-v3
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: sentence
dtype: string
- name: path
dtype: string
- name: input_length
dtype: int64
- name: input_features
sequence:
sequence: float32
- name: labels
sequence: int64
- name: labels_length
dtype: int64
splits:
- name: train
num_bytes: 103655763291.19
num_examples: 62837
download_size: 21846425218
dataset_size: 103655763291.19
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征项:
- 名称:音频(audio),数据类型为音频格式,采样率为16000赫兹
- 名称:语句,数据类型为字符串
- 名称:文件路径,数据类型为字符串
- 名称:输入长度,数据类型为64位整型(int64)
- 名称:输入特征,为嵌套序列,元素类型为32位浮点型(float32)
- 名称:标签,为64位整型序列
- 名称:标签长度,数据类型为64位整型(int64)
数据集划分:
- 名称:训练集(train),数据字节数为103655763291.19,样本数量为62837
下载大小:21846425218字节
数据集总大小:103655763291.19字节
数据集配置:
- 配置名称:默认配置(default),数据文件为:训练集划分对应路径为 data/train-*
提供机构:
awajai



