Codec-SUPERB/superb_ks_unit
收藏Hugging Face2024-01-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/superb_ks_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 5079738
num_examples: 3081
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 5079738
num_examples: 3081
- name: academicodec_hifi_24k_320d
num_bytes: 7544538
num_examples: 3081
- name: audiodec_24k_320d
num_bytes: 15974154
num_examples: 3081
- name: dac_16k
num_bytes: 15037530
num_examples: 3081
- name: dac_24k
num_bytes: 59650410
num_examples: 3081
- name: dac_44k
num_bytes: 19511142
num_examples: 3081
- name: encodec_24k_12bps
num_bytes: 29875626
num_examples: 3081
- name: encodec_24k_1_5bps
num_bytes: 3822690
num_examples: 3081
- name: encodec_24k_24bps
num_bytes: 59650410
num_examples: 3081
- name: encodec_24k_3bps
num_bytes: 7544538
num_examples: 3081
- name: encodec_24k_6bps
num_bytes: 14988234
num_examples: 3081
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 40720746
num_examples: 3081
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 40720746
num_examples: 3081
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 39932010
num_examples: 3081
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 20213610
num_examples: 3081
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 39932010
num_examples: 3081
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 20213610
num_examples: 3081
- name: speech_tokenizer_16k
num_bytes: 10058634
num_examples: 3081
download_size: 71550956
dataset_size: 455550114
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
---
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- unit: 包含一个序列,序列类型为int64。
数据集分割
- academicodec_hifi_16k_320d: 字节数为5079738,样本数为3081。
- academicodec_hifi_16k_320d_large_uni: 字节数为5079738,样本数为3081。
- academicodec_hifi_24k_320d: 字节数为7544538,样本数为3081。
- audiodec_24k_320d: 字节数为15974154,样本数为3081。
- dac_16k: 字节数为15037530,样本数为3081。
- dac_24k: 字节数为59650410,样本数为3081。
- dac_44k: 字节数为19511142,样本数为3081。
- encodec_24k_12bps: 字节数为29875626,样本数为3081。
- encodec_24k_1_5bps: 字节数为3822690,样本数为3081。
- encodec_24k_24bps: 字节数为59650410,样本数为3081。
- encodec_24k_3bps: 字节数为7544538,样本数为3081。
- encodec_24k_6bps: 字节数为14988234,样本数为3081。
- funcodec_en_libritts_16k_gr1nq32ds320: 字节数为40720746,样本数为3081。
- funcodec_en_libritts_16k_gr8nq32ds320: 字节数为40720746,样本数为3081。
- funcodec_en_libritts_16k_nq32ds320: 字节数为39932010,样本数为3081。
- funcodec_en_libritts_16k_nq32ds640: 字节数为20213610,样本数为3081。
- funcodec_zh_en_16k_nq32ds320: 字节数为39932010,样本数为3081。
- funcodec_zh_en_16k_nq32ds640: 字节数为20213610,样本数为3081。
- speech_tokenizer_16k: 字节数为10058634,样本数为3081。
数据集大小
- 下载大小: 71550956字节。
- 数据集大小: 455550114字节。
配置
- default: 包含多个数据文件,每个文件对应一个特定的分割,路径格式为
data/*。



