natmin322/28k_vietnamese_voice_augmented_of_VigBigData

Name: natmin322/28k_vietnamese_voice_augmented_of_VigBigData
Creator: natmin322
Published: 2023-08-12 17:18:29
License: 暂无描述

Hugging Face2023-08-12 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/natmin322/28k_vietnamese_voice_augmented_of_VigBigData

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: train_1 path: data/train_1-* - split: train_2 path: data/train_2-* - split: train_3 path: data/train_3-* - split: train_4 path: data/train_4-* - split: train_5 path: data/train_5-* - split: test path: data/test-* dataset_info: features: - name: audio dtype: audio - name: sentence dtype: string splits: - name: train_1 num_bytes: 1433691842.0 num_examples: 5000 - name: train_2 num_bytes: 1026073200.0 num_examples: 5000 - name: train_3 num_bytes: 1113535830.0 num_examples: 5000 - name: train_4 num_bytes: 1489647293.0 num_examples: 5000 - name: train_5 num_bytes: 1416405046.0 num_examples: 5000 - name: test num_bytes: 886300388.18 num_examples: 3005 download_size: 6939675259 dataset_size: 7365653599.18 --- # Dataset Card for "28k_vietnamese_voice_augmented_of_VigBigData" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

natmin322

原始信息汇总

数据集概述

配置信息

默认配置：
- 数据文件：
  - train_1：路径为 data/train_1-*
  - train_2：路径为 data/train_2-*
  - train_3：路径为 data/train_3-*
  - train_4：路径为 data/train_4-*
  - train_5：路径为 data/train_5-*
  - test：路径为 data/test-*

数据集信息

特征：
- audio：数据类型为 audio
- sentence：数据类型为 string
拆分：
- train_1：字节数为 1433691842.0，样本数为 5000
- train_2：字节数为 1026073200.0，样本数为 5000
- train_3：字节数为 1113535830.0，样本数为 5000
- train_4：字节数为 1489647293.0，样本数为 5000
- train_5：字节数为 1416405046.0，样本数为 5000
- test：字节数为 886300388.18，样本数为 3005
数据大小：
- 下载大小：6939675259 字节
- 数据集大小：7365653599.18 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集