Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_6

Name: Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_6
Creator: Jayem-11
Published: 2023-11-13 23:03:18
License: 暂无描述

Hugging Face2023-11-13 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_6

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: audio dtype: audio: sampling_rate: 16000 - name: sentence dtype: string - name: input_length dtype: int64 - name: input_features sequence: sequence: float32 - name: labels sequence: int64 - name: labels_length dtype: int64 splits: - name: train num_bytes: 13360423472.25 num_examples: 11734 download_size: 4087377242 dataset_size: 13360423472.25 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "mozilla_commonvoice_hackathon_preprocessed_train_batch_6" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Jayem-11

原始信息汇总

数据集概述

数据集信息

特征：
- audio：音频数据，采样率为16000。
- sentence：字符串类型，表示句子。
- input_length：整数类型，表示输入长度。
- input_features：序列类型，序列元素为浮点数。
- labels：序列类型，序列元素为整数。
- labels_length：整数类型，表示标签长度。
分割：
- train：训练集，包含11734个样本，总大小为13360423472.25字节。
下载大小：4087377242字节。
数据集大小：13360423472.25字节。

配置

默认配置：
- data_files：
  - train：路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集