Hunzla/simplified_google_speech_commands_wav2vec2_960h

Name: Hunzla/simplified_google_speech_commands_wav2vec2_960h
Creator: Hunzla
Published: 2024-01-23 13:41:31
License: 暂无描述

Hugging Face2024-01-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Hunzla/simplified_google_speech_commands_wav2vec2_960h

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: file dtype: string - name: audio dtype: audio: sampling_rate: 16000 - name: label dtype: class_label: names: '0': 'yes' '1': 'no' '2': up '3': down '4': left '5': right '6': 'on' '7': 'off' '8': stop '9': go '10': zero '11': one '12': two '13': three '14': four '15': five '16': six '17': seven '18': eight '19': nine '20': bed '21': bird '22': cat '23': dog '24': happy '25': house '26': marvin '27': sheila '28': tree '29': wow '30': backward '31': forward '32': follow '33': learn '34': visual '35': _silence_ - name: is_unknown dtype: bool - name: speaker_id dtype: string - name: utterance_id dtype: int8 - name: embeddings sequence: sequence: float32 - name: input_length dtype: int64 - name: label_encodings sequence: int64 splits: - name: train num_bytes: 11238935260.0 num_examples: 84848 - name: test num_bytes: 650121138.75 num_examples: 4890 - name: validation num_bytes: 1322841633.25 num_examples: 9982 download_size: 13489230691 dataset_size: 13211898032.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* - split: validation path: data/validation-* ---

提供机构：

Hunzla

原始信息汇总

数据集概述

数据特征

file: 文件名，数据类型为字符串。
audio: 音频数据，采样率为16000。
label: 标签，包含多个类别名称，如yes, no, up, down等。
is_unknown: 是否未知，数据类型为布尔值。
speaker_id: 说话者ID，数据类型为字符串。
utterance_id: 话语ID，数据类型为int8。
embeddings: 嵌入向量，数据类型为float32。
input_length: 输入长度，数据类型为int64。
label_encodings: 标签编码，数据类型为int64。

数据分割

train: 训练集，包含84848个样本，总字节数为11238935260.0。
test: 测试集，包含4890个样本，总字节数为650121138.75。
validation: 验证集，包含9982个样本，总字节数为1322841633.25。

数据大小

下载大小: 13489230691字节。
数据集大小: 13211898032.0字节。

配置

default: 默认配置，包含训练、测试和验证集的路径。
- 训练集路径: data/train-*
- 测试集路径: data/test-*
- 验证集路径: data/validation-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集