saketag73/gtzan_truncate_processed_for_distilhubert
收藏Hugging Face2024-04-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/saketag73/gtzan_truncate_processed_for_distilhubert
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: label
dtype:
class_label:
names:
'0': blues
'1': classical
'2': country
'3': disco
'4': hiphop
'5': jazz
'6': metal
'7': pop
'8': reggae
'9': rock
- name: input_values
sequence: float32
- name: attention_mask
sequence: int32
splits:
- name: train
num_bytes: 3452173752
num_examples: 1798
- name: test
num_bytes: 384002664
num_examples: 200
download_size: 1923112317
dataset_size: 3836176416
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
提供机构:
saketag73
原始信息汇总
数据集概述
数据集特征
-
label
- 数据类型: 类别标签
- 类别名称:
- 0: blues
- 1: classical
- 2: country
- 3: disco
- 4: hiphop
- 5: jazz
- 6: metal
- 7: pop
- 8: reggae
- 9: rock
-
input_values
- 数据类型: 序列, float32
-
attention_mask
- 数据类型: 序列, int32
数据集分割
-
训练集
- 大小: 3452173752 字节
- 样本数: 1798
-
测试集
- 大小: 384002664 字节
- 样本数: 200
数据集大小
- 下载大小: 1923112317 字节
- 数据集总大小: 3836176416 字节
数据文件配置
- 默认配置
- 训练集路径: data/train-*
- 测试集路径: data/test-*
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是经过截断和处理的GTZAN音乐数据集,专门为DistilHubert模型优化,包含10种音乐流派标签,以时间序列格式存储为parquet文件。数据集规模为1,998行,分为1,800行训练数据和200行测试数据,总大小为1.92 GB,提供音频特征序列和注意力掩码,适用于音频分类任务。
以上内容由遇见数据集搜集并总结生成



