awajai/augmented-dataset-part1-prepared-stt-v3

Name: awajai/augmented-dataset-part1-prepared-stt-v3
Creator: awajai
Published: 2024-07-25 08:35:58
License: 暂无描述

Hugging Face2024-07-25 更新2025-04-26 收录

下载链接：

https://hf-mirror.com/datasets/awajai/augmented-dataset-part1-prepared-stt-v3

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: audio dtype: audio: sampling_rate: 16000 - name: sentence dtype: string - name: path dtype: string - name: input_length dtype: int64 - name: input_features sequence: sequence: float32 - name: labels sequence: int64 - name: labels_length dtype: int64 splits: - name: train num_bytes: 103655763291.19 num_examples: 62837 download_size: 21846425218 dataset_size: 103655763291.19 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征项： - 名称：音频（audio），数据类型为音频格式，采样率为16000赫兹 - 名称：语句，数据类型为字符串 - 名称：文件路径，数据类型为字符串 - 名称：输入长度，数据类型为64位整型（int64） - 名称：输入特征，为嵌套序列，元素类型为32位浮点型（float32） - 名称：标签，为64位整型序列 - 名称：标签长度，数据类型为64位整型（int64）数据集划分： - 名称：训练集（train），数据字节数为103655763291.19，样本数量为62837 下载大小：21846425218字节数据集总大小：103655763291.19字节数据集配置： - 配置名称：默认配置（default），数据文件为：训练集划分对应路径为 data/train-*

提供机构：

awajai

5,000+

优质数据集

54 个

任务类型

进入经典数据集