xaviviro/common_voice_es_16_1_accent
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xaviviro/common_voice_es_16_1_accent
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: client_id
dtype: string
- name: path
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 48000
- name: sentence
dtype: string
- name: up_votes
dtype: int64
- name: down_votes
dtype: int64
- name: age
dtype: string
- name: gender
dtype: string
- name: accent
dtype: string
- name: locale
dtype: string
- name: segment
dtype: string
- name: variant
dtype: string
splits:
- name: train
num_bytes: 10306742828.244589
num_examples: 236042
- name: test
num_bytes: 104674798.82142359
num_examples: 2752
download_size: 8755162997
dataset_size: 10411417627.066013
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 客户端ID(client_id):数据类型为字符串
- 文件路径(path):数据类型为字符串
- 音频(audio):数据类型为采样率48000的音频格式
- 语句文本(sentence):数据类型为字符串
- 点赞数(up_votes):数据类型为64位整数
- 点踩数(down_votes):数据类型为64位整数
- 年龄(age):数据类型为字符串
- 性别(gender):数据类型为字符串
- 口音(accent):数据类型为字符串
- 语言地区(locale):数据类型为字符串
- 片段(segment):数据类型为字符串
- 变体(variant):数据类型为字符串
数据集拆分:
- 训练集(train):占用字节数10306742828.244589,样本量236042
- 测试集(test):占用字节数104674798.82142359,样本量2752
下载总大小为8755162997字节,数据集总存储大小为10411417627.066013字节
数据集配置:
- 默认配置(default):数据文件对应关系为:训练集指向data/train-*,测试集指向data/test-*
提供机构:
xaviviro
原始信息汇总
数据集概述
数据集特征
- client_id: 字符串类型
- path: 字符串类型
- audio: 音频类型,采样率为48000
- sentence: 字符串类型
- up_votes: 64位整数类型
- down_votes: 64位整数类型
- age: 字符串类型
- gender: 字符串类型
- accent: 字符串类型
- locale: 字符串类型
- segment: 字符串类型
- variant: 字符串类型
数据集分割
- train:
- 字节数: 10306742828.244589
- 样本数: 236042
- test:
- 字节数: 104674798.82142359
- 样本数: 2752
数据集大小
- 下载大小: 8755162997
- 数据集大小: 10411417627.066013
配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
- data_files:



