Codec-SUPERB/gtzan_music_speech_unit
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/gtzan_music_speech_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 6154584
num_examples: 128
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 6154584
num_examples: 128
- name: academicodec_hifi_24k_320d
num_bytes: 9226584
num_examples: 128
- name: audiodec_24k_320d
num_bytes: 19673432
num_examples: 128
- name: dac_16k
num_bytes: 20142424
num_examples: 128
- name: dac_24k
num_bytes: 82370904
num_examples: 128
- name: dac_44k
num_bytes: 26850136
num_examples: 128
- name: encodec_24k_12bps
num_bytes: 36880728
num_examples: 128
- name: encodec_24k_1_5bps
num_bytes: 4617560
num_examples: 128
- name: encodec_24k_24bps
num_bytes: 73752920
num_examples: 128
- name: encodec_24k_3bps
num_bytes: 9226584
num_examples: 128
- name: encodec_24k_6bps
num_bytes: 18444632
num_examples: 128
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 49209688
num_examples: 128
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 49209688
num_examples: 128
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 49176920
num_examples: 128
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 24600920
num_examples: 128
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 49176920
num_examples: 128
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 24600920
num_examples: 128
- name: speech_tokenizer_16k
num_bytes: 12300632
num_examples: 128
download_size: 89394571
dataset_size: 571770760
---
# Dataset Card for "gtzan_music_speech_unit"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个文件对应不同的分割(split)和路径(path)。
数据文件详情
- academicodec_hifi_16k_320d
- 路径:
data/academicodec_hifi_16k_320d-* - 字节数:6154584
- 样本数:128
- 路径:
- academicodec_hifi_16k_320d_large_uni
- 路径:
data/academicodec_hifi_16k_320d_large_uni-* - 字节数:6154584
- 样本数:128
- 路径:
- academicodec_hifi_24k_320d
- 路径:
data/academicodec_hifi_24k_320d-* - 字节数:9226584
- 样本数:128
- 路径:
- audiodec_24k_320d
- 路径:
data/audiodec_24k_320d-* - 字节数:19673432
- 样本数:128
- 路径:
- dac_16k
- 路径:
data/dac_16k-* - 字节数:20142424
- 样本数:128
- 路径:
- dac_24k
- 路径:
data/dac_24k-* - 字节数:82370904
- 样本数:128
- 路径:
- dac_44k
- 路径:
data/dac_44k-* - 字节数:26850136
- 样本数:128
- 路径:
- encodec_24k_12bps
- 路径:
data/encodec_24k_12bps-* - 字节数:36880728
- 样本数:128
- 路径:
- encodec_24k_1_5bps
- 路径:
data/encodec_24k_1_5bps-* - 字节数:4617560
- 样本数:128
- 路径:
- encodec_24k_24bps
- 路径:
data/encodec_24k_24bps-* - 字节数:73752920
- 样本数:128
- 路径:
- encodec_24k_3bps
- 路径:
data/encodec_24k_3bps-* - 字节数:9226584
- 样本数:128
- 路径:
- encodec_24k_6bps
- 路径:
data/encodec_24k_6bps-* - 字节数:18444632
- 样本数:128
- 路径:
- funcodec_en_libritts_16k_gr1nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr1nq32ds320-* - 字节数:49209688
- 样本数:128
- 路径:
- funcodec_en_libritts_16k_gr8nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr8nq32ds320-* - 字节数:49209688
- 样本数:128
- 路径:
- funcodec_en_libritts_16k_nq32ds320
- 路径:
data/funcodec_en_libritts_16k_nq32ds320-* - 字节数:49176920
- 样本数:128
- 路径:
- funcodec_en_libritts_16k_nq32ds640
- 路径:
data/funcodec_en_libritts_16k_nq32ds640-* - 字节数:24600920
- 样本数:128
- 路径:
- funcodec_zh_en_16k_nq32ds320
- 路径:
data/funcodec_zh_en_16k_nq32ds320-* - 字节数:49176920
- 样本数:128
- 路径:
- funcodec_zh_en_16k_nq32ds640
- 路径:
data/funcodec_zh_en_16k_nq32ds640-* - 字节数:24600920
- 样本数:128
- 路径:
- speech_tokenizer_16k
- 路径:
data/speech_tokenizer_16k-* - 字节数:12300632
- 样本数:128
- 路径:
数据集特征
- id:字符串类型
- unit:序列类型,包含整数64位
数据集大小
- 下载大小:89394571字节
- 数据集大小:571770760字节



