NathanRoll/commonvoice_test_labeled
收藏Hugging Face2023-10-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NathanRoll/commonvoice_test_labeled
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: client_id
dtype: string
- name: path
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 48000
- name: sentence
dtype: string
- name: up_votes
dtype: int64
- name: down_votes
dtype: int64
- name: age
dtype: string
- name: gender
dtype: string
- name: accent
dtype: string
- name: locale
dtype: string
- name: segment
dtype: string
- name: variant
dtype: string
splits:
- name: test
num_bytes: 64662583.85453212
num_examples: 1550
download_size: 64487018
dataset_size: 64662583.85453212
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
# Dataset Card for "commonvoice_test_labeled"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 名称: 客户端ID(client_id)
数据类型: 字符串
- 名称: 路径(path)
数据类型: 字符串
- 名称: 音频(audio)
数据类型:
音频:
采样率: 48000
- 名称: 句子(sentence)
数据类型: 字符串
- 名称: 赞成票数(up_votes)
数据类型: 64位整数
- 名称: 反对票数(down_votes)
数据类型: 64位整数
- 名称: 年龄(age)
数据类型: 字符串
- 名称: 性别(gender)
数据类型: 字符串
- 名称: 口音(accent)
数据类型: 字符串
- 名称: 语言区域(locale)
数据类型: 字符串
- 名称: 片段(segment)
数据类型: 字符串
- 名称: 变体(variant)
数据类型: 字符串
数据拆分:
- 名称: 测试集(test)
字节数: 64662583.85453212
样本数量: 1550
下载大小: 64487018
数据集总大小: 64662583.85453212
配置项:
- 配置名称: 默认配置(default)
数据文件:
- 拆分集: 测试集(test)
路径: data/test-*
# 「commonvoice_test_labeled」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
NathanRoll
原始信息汇总
数据集概述
数据集信息
- 特征列表:
client_id: 字符串类型path: 字符串类型audio: 音频类型,采样率为48000sentence: 字符串类型up_votes: 整数类型down_votes: 整数类型age: 字符串类型gender: 字符串类型accent: 字符串类型locale: 字符串类型segment: 字符串类型variant: 字符串类型
数据分割
- 测试集:
- 名称:
test - 字节数: 64662583.85453212
- 样本数: 1550
- 名称:
数据集大小
- 下载大小: 64487018
- 数据集大小: 64662583.85453212
配置
- 配置名称:
default- 数据文件:
- 分割:
test - 路径:
data/test-*
- 分割:
- 数据文件:



