Hunzla/google-speech-commands-wav2vec2-960h

Name: Hunzla/google-speech-commands-wav2vec2-960h
Creator: Hunzla
Published: 2024-01-22 14:20:29
License: 暂无描述

Hugging Face2024-01-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Hunzla/google-speech-commands-wav2vec2-960h

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: file dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: label dtype: class_label: names: '0': 'yes' '1': 'no' '2': up '3': down '4': left '5': right '6': 'on' '7': 'off' '8': stop '9': go '10': zero '11': one '12': two '13': three '14': four '15': five '16': six '17': seven '18': eight '19': nine '20': bed '21': bird '22': cat '23': dog '24': happy '25': house '26': marvin '27': sheila '28': tree '29': wow '30': backward '31': forward '32': follow '33': learn '34': visual '35': _silence_ - name: is_unknown dtype: bool - name: speaker_id dtype: string - name: utterance_id dtype: int8 - name: embeddings sequence: sequence: float32 - name: input_length dtype: int64 splits: - name: train num_bytes: 11084524542.0 num_examples: 84848 - name: test num_bytes: 648693133.75 num_examples: 4890 - name: validation num_bytes: 1306736633.25 num_examples: 9982 download_size: 13389173178 dataset_size: 13039954309.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: validation path: data/validation-* ---

提供机构：

Hunzla

原始信息汇总

数据集信息

特征

file: 文件名，数据类型为字符串。
audio: 音频数据，采样率为16000。
label: 类别标签，包含以下类别名称：
- 0: yes
- 1: no
- 2: up
- 3: down
- 4: left
- 5: right
- 6: on
- 7: off
- 8: stop
- 9: go
- 10: zero
- 11: one
- 12: two
- 13: three
- 14: four
- 15: five
- 16: six
- 17: seven
- 18: eight
- 19: nine
- 20: bed
- 21: bird
- 22: cat
- 23: dog
- 24: happy
- 25: house
- 26: marvin
- 27: sheila
- 28: tree
- 29: wow
- 30: backward
- 31: forward
- 32: follow
- 33: learn
- 34: visual
- 35: silence
is_unknown: 是否未知，数据类型为布尔值。
speaker_id: 说话者ID，数据类型为字符串。
utterance_id: 话语ID，数据类型为int8。
embeddings: 嵌入向量，数据类型为float32。
input_length: 输入长度，数据类型为int64。

数据分割

train: 训练集，包含84848个样本，大小为11084524542.0字节。
test: 测试集，包含4890个样本，大小为648693133.75字节。
validation: 验证集，包含9982个样本，大小为1306736633.25字节。

数据集大小

下载大小: 13389173178字节
数据集大小: 13039954309.0字节

配置

default: 默认配置，包含以下数据文件路径：
- 训练集: data/train-*
- 测试集: data/test-*
- 验证集: data/validation-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集