Hunzla/simplified_google_speech_commands_wav2vec2_960h
收藏Hugging Face2024-01-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hunzla/simplified_google_speech_commands_wav2vec2_960h
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: label
dtype:
class_label:
names:
'0': 'yes'
'1': 'no'
'2': up
'3': down
'4': left
'5': right
'6': 'on'
'7': 'off'
'8': stop
'9': go
'10': zero
'11': one
'12': two
'13': three
'14': four
'15': five
'16': six
'17': seven
'18': eight
'19': nine
'20': bed
'21': bird
'22': cat
'23': dog
'24': happy
'25': house
'26': marvin
'27': sheila
'28': tree
'29': wow
'30': backward
'31': forward
'32': follow
'33': learn
'34': visual
'35': _silence_
- name: is_unknown
dtype: bool
- name: speaker_id
dtype: string
- name: utterance_id
dtype: int8
- name: embeddings
sequence:
sequence: float32
- name: input_length
dtype: int64
- name: label_encodings
sequence: int64
splits:
- name: train
num_bytes: 11238935260.0
num_examples: 84848
- name: test
num_bytes: 650121138.75
num_examples: 4890
- name: validation
num_bytes: 1322841633.25
num_examples: 9982
download_size: 13489230691
dataset_size: 13211898032.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
提供机构:
Hunzla
原始信息汇总
数据集概述
数据特征
- file: 文件名,数据类型为字符串。
- audio: 音频数据,采样率为16000。
- label: 标签,包含多个类别名称,如yes, no, up, down等。
- is_unknown: 是否未知,数据类型为布尔值。
- speaker_id: 说话者ID,数据类型为字符串。
- utterance_id: 话语ID,数据类型为int8。
- embeddings: 嵌入向量,数据类型为float32。
- input_length: 输入长度,数据类型为int64。
- label_encodings: 标签编码,数据类型为int64。
数据分割
- train: 训练集,包含84848个样本,总字节数为11238935260.0。
- test: 测试集,包含4890个样本,总字节数为650121138.75。
- validation: 验证集,包含9982个样本,总字节数为1322841633.25。
数据大小
- 下载大小: 13489230691字节。
- 数据集大小: 13211898032.0字节。
配置
- default: 默认配置,包含训练、测试和验证集的路径。
- 训练集路径:
data/train-* - 测试集路径:
data/test-* - 验证集路径:
data/validation-*
- 训练集路径:



