five

qmeeus/voxpopuli

收藏
Hugging Face2024-02-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/qmeeus/voxpopuli
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: de features: - name: audio_id dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: text dtype: string - name: language dtype: string splits: - name: train num_bytes: 61603981153.568 num_examples: 108473 - name: validation num_bytes: 1149586917.507 num_examples: 2109 download_size: 52060225655 dataset_size: 62753568071.075 - config_name: es features: - name: audio_id dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: text dtype: string - name: language dtype: string splits: - name: train num_bytes: 36533665201.936 num_examples: 50922 - name: validation num_bytes: 1173444834.383 num_examples: 1631 download_size: 1005381345 dataset_size: 37707110036.319 - config_name: fr features: - name: audio_id dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: text dtype: string - name: language dtype: string splits: - name: train num_bytes: 48346650213.26 num_examples: 73561 - name: validation num_bytes: 1149779276.605 num_examples: 1727 download_size: 17314564262 dataset_size: 49496429489.865005 - config_name: nl features: - name: audio_id dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: text dtype: string - name: language dtype: string splits: - name: train num_bytes: 10436544940.608 num_examples: 20968 - name: validation num_bytes: 636925883.64 num_examples: 1230 download_size: 9404833804 dataset_size: 11073470824.248 configs: - config_name: de data_files: - split: train path: de/train-* - split: validation path: de/validation-* - config_name: es data_files: - split: train path: es/train-* - split: validation path: es/validation-* - config_name: fr data_files: - split: train path: fr/train-* - split: validation path: fr/validation-* - config_name: nl data_files: - split: train path: nl/train-* - split: validation path: nl/validation-* --- # Dataset Card for "voxpopuli" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
qmeeus
原始信息汇总

数据集概述

配置名称:de

  • 特征
    • audio_id: 字符串类型
    • audio: 音频类型,采样率为16000
    • text: 字符串类型
    • language: 字符串类型
  • 分割
    • train: 字节数为61603981153.568,样本数为108473
    • validation: 字节数为1149586917.507,样本数为2109
  • 下载大小:52060225655
  • 数据集大小:62753568071.075

配置名称:es

  • 特征
    • audio_id: 字符串类型
    • audio: 音频类型,采样率为16000
    • text: 字符串类型
    • language: 字符串类型
  • 分割
    • train: 字节数为36533665201.936,样本数为50922
    • validation: 字节数为1173444834.383,样本数为1631
  • 下载大小:1005381345
  • 数据集大小:37707110036.319

配置名称:fr

  • 特征
    • audio_id: 字符串类型
    • audio: 音频类型,采样率为16000
    • text: 字符串类型
    • language: 字符串类型
  • 分割
    • train: 字节数为48346650213.26,样本数为73561
    • validation: 字节数为1149779276.605,样本数为1727
  • 下载大小:17314564262
  • 数据集大小:49496429489.865005

配置名称:nl

  • 特征
    • audio_id: 字符串类型
    • audio: 音频类型,采样率为16000
    • text: 字符串类型
    • language: 字符串类型
  • 分割
    • train: 字节数为10436544940.608,样本数为20968
    • validation: 字节数为636925883.64,样本数为1230
  • 下载大小:9404833804
  • 数据集大小:11073470824.248
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作