DewiBrynJones/commonvoice_17_0_cy
收藏Hugging Face2024-04-10 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/DewiBrynJones/commonvoice_17_0_cy
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentence
dtype: string
- name: language
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
splits:
- name: train
num_bytes: 309493497.0
num_examples: 7956
- name: dev
num_bytes: 211629186.0
num_examples: 5371
- name: test
num_bytes: 211691650.0
num_examples: 5378
- name: train_s99
num_bytes: 2368721108.0
num_examples: 64035
- name: dev_s99
num_bytes: 491789187.0
num_examples: 13140
- name: test_s99
num_bytes: 507444953.0
num_examples: 13189
download_size: 4041704710
dataset_size: 4100769581.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
- split: train_s99
path: data/train_s99-*
- split: dev_s99
path: data/dev_s99-*
- split: test_s99
path: data/test_s99-*
---
提供机构:
DewiBrynJones
原始信息汇总
数据集概述
数据集特征
- sentence:文本类型,数据类型为字符串。
- language:文本类型,数据类型为字符串。
- audio:音频数据,采样率为16000。
数据集分割
- train:包含7956个样本,总大小为309493497字节。
- dev:包含5371个样本,总大小为211629186字节。
- test:包含5378个样本,总大小为211691650字节。
- train_s99:包含64035个样本,总大小为2368721108字节。
- dev_s99:包含13140个样本,总大小为491789187字节。
- test_s99:包含13189个样本,总大小为507444953字节。
数据集大小
- 下载大小:4041704710字节。
- 数据集总大小:4100769581字节。
数据文件配置
- config_name: default
- train:路径为
data/train-*。 - dev:路径为
data/dev-*。 - test:路径为
data/test-*。 - train_s99:路径为
data/train_s99-*。 - dev_s99:路径为
data/dev_s99-*。 - test_s99:路径为
data/test_s99-*。
- train:路径为



