Hunzla/google-speech-commands-wav2vec2-960h
收藏Hugging Face2024-01-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Hunzla/google-speech-commands-wav2vec2-960h
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file
dtype: string
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: label
dtype:
class_label:
names:
'0': 'yes'
'1': 'no'
'2': up
'3': down
'4': left
'5': right
'6': 'on'
'7': 'off'
'8': stop
'9': go
'10': zero
'11': one
'12': two
'13': three
'14': four
'15': five
'16': six
'17': seven
'18': eight
'19': nine
'20': bed
'21': bird
'22': cat
'23': dog
'24': happy
'25': house
'26': marvin
'27': sheila
'28': tree
'29': wow
'30': backward
'31': forward
'32': follow
'33': learn
'34': visual
'35': _silence_
- name: is_unknown
dtype: bool
- name: speaker_id
dtype: string
- name: utterance_id
dtype: int8
- name: embeddings
sequence:
sequence: float32
- name: input_length
dtype: int64
splits:
- name: train
num_bytes: 11084524542.0
num_examples: 84848
- name: test
num_bytes: 648693133.75
num_examples: 4890
- name: validation
num_bytes: 1306736633.25
num_examples: 9982
download_size: 13389173178
dataset_size: 13039954309.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
提供机构:
Hunzla
原始信息汇总
数据集信息
特征
- file: 文件名,数据类型为字符串。
- audio: 音频数据,采样率为16000。
- label: 类别标签,包含以下类别名称:
- 0: yes
- 1: no
- 2: up
- 3: down
- 4: left
- 5: right
- 6: on
- 7: off
- 8: stop
- 9: go
- 10: zero
- 11: one
- 12: two
- 13: three
- 14: four
- 15: five
- 16: six
- 17: seven
- 18: eight
- 19: nine
- 20: bed
- 21: bird
- 22: cat
- 23: dog
- 24: happy
- 25: house
- 26: marvin
- 27: sheila
- 28: tree
- 29: wow
- 30: backward
- 31: forward
- 32: follow
- 33: learn
- 34: visual
- 35: silence
- is_unknown: 是否未知,数据类型为布尔值。
- speaker_id: 说话者ID,数据类型为字符串。
- utterance_id: 话语ID,数据类型为int8。
- embeddings: 嵌入向量,数据类型为float32。
- input_length: 输入长度,数据类型为int64。
数据分割
- train: 训练集,包含84848个样本,大小为11084524542.0字节。
- test: 测试集,包含4890个样本,大小为648693133.75字节。
- validation: 验证集,包含9982个样本,大小为1306736633.25字节。
数据集大小
- 下载大小: 13389173178字节
- 数据集大小: 13039954309.0字节
配置
- default: 默认配置,包含以下数据文件路径:
- 训练集:
data/train-* - 测试集:
data/test-* - 验证集:
data/validation-*
- 训练集:



