five

natmin322/28k_vietnamese_voice_augmented_of_VigBigData

收藏
Hugging Face2023-08-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/natmin322/28k_vietnamese_voice_augmented_of_VigBigData
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: train_1 path: data/train_1-* - split: train_2 path: data/train_2-* - split: train_3 path: data/train_3-* - split: train_4 path: data/train_4-* - split: train_5 path: data/train_5-* - split: test path: data/test-* dataset_info: features: - name: audio dtype: audio - name: sentence dtype: string splits: - name: train_1 num_bytes: 1433691842.0 num_examples: 5000 - name: train_2 num_bytes: 1026073200.0 num_examples: 5000 - name: train_3 num_bytes: 1113535830.0 num_examples: 5000 - name: train_4 num_bytes: 1489647293.0 num_examples: 5000 - name: train_5 num_bytes: 1416405046.0 num_examples: 5000 - name: test num_bytes: 886300388.18 num_examples: 3005 download_size: 6939675259 dataset_size: 7365653599.18 --- # Dataset Card for "28k_vietnamese_voice_augmented_of_VigBigData" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
natmin322
原始信息汇总

数据集概述

配置信息

  • 默认配置
    • 数据文件
      • train_1:路径为 data/train_1-*
      • train_2:路径为 data/train_2-*
      • train_3:路径为 data/train_3-*
      • train_4:路径为 data/train_4-*
      • train_5:路径为 data/train_5-*
      • test:路径为 data/test-*

数据集信息

  • 特征

    • audio:数据类型为 audio
    • sentence:数据类型为 string
  • 拆分

    • train_1:字节数为 1433691842.0,样本数为 5000
    • train_2:字节数为 1026073200.0,样本数为 5000
    • train_3:字节数为 1113535830.0,样本数为 5000
    • train_4:字节数为 1489647293.0,样本数为 5000
    • train_5:字节数为 1416405046.0,样本数为 5000
    • test:字节数为 886300388.18,样本数为 3005
  • 数据大小

    • 下载大小:6939675259 字节
    • 数据集大小:7365653599.18 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作