Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_4

Name: Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_4
Creator: Jayem-11
Published: 2023-11-06 14:28:34
License: 暂无描述

Hugging Face2023-11-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Jayem-11/mozilla_commonvoice_hackathon_preprocessed_train_batch_4

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: audio dtype: audio: sampling_rate: 16000 - name: sentence dtype: string - name: input_length dtype: int64 - name: input_features sequence: sequence: float32 - name: labels sequence: int64 - name: labels_length dtype: int64 splits: - name: train num_bytes: 15590806829.875 num_examples: 13689 download_size: 4768732812 dataset_size: 15590806829.875 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "mozilla_commonvoice_hackathon_preprocessed_train_batch_4" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Jayem-11

原始信息汇总

数据集概述

数据集信息

特征列表：
- audio：音频数据，采样率为16000。
- sentence：字符串类型，表示句子。
- input_length：整数类型，表示输入长度。
- input_features：序列类型，序列元素为浮点数。
- labels：序列类型，序列元素为整数。
- labels_length：整数类型，表示标签长度。
数据分割：
- train：训练集，包含13689个样本，总大小为15590806829.875字节。
数据集大小：
- 下载大小：4768732812字节
- 数据集总大小：15590806829.875字节

配置信息

默认配置：
- config_name：default
- data_files：
  - split：train
  - path：data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集