SaffalPoosh/AN4_ASR_dataset

Name: SaffalPoosh/AN4_ASR_dataset
Creator: SaffalPoosh
Published: 2023-11-02 15:08:20
License: 暂无描述

Hugging Face2023-11-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SaffalPoosh/AN4_ASR_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* dataset_info: features: - name: audio_filepath dtype: audio - name: duration dtype: float64 - name: text dtype: string splits: - name: train num_bytes: 81556453.0 num_examples: 948 - name: test num_bytes: 11434382.0 num_examples: 130 download_size: 86823191 dataset_size: 92990835.0 --- # Dataset Card for "AN4_ASR_dataset" This dataset can be used to train NEMO English Speech models. Audio files are sampled at `16kHz`. [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

SaffalPoosh

原始信息汇总

数据集概述

配置

默认配置 (default)
- 数据文件路径：
  - 训练集 (train): data/train-*
  - 测试集 (test): data/test-*

数据特征

audio_filepath: 音频文件路径，数据类型为 audio
duration: 音频时长，数据类型为 float64
text: 文本内容，数据类型为 string

数据分割

训练集 (train)
- 字节数: 81556453.0
- 样本数: 948
测试集 (test)
- 字节数: 11434382.0
- 样本数: 130

数据集大小

下载大小: 86823191
数据集大小: 92990835.0

其他信息

音频文件采样率为 16kHz

5,000+

优质数据集

54 个

任务类型

进入经典数据集