Codec-SUPERB/vox_lingua_top10_unit
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/vox_lingua_top10_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 29050426
num_examples: 972
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 29050426
num_examples: 972
- name: academicodec_hifi_24k_320d
num_bytes: 43544890
num_examples: 972
- name: audiodec_24k_320d
num_bytes: 92891386
num_examples: 972
- name: dac_16k
num_bytes: 109267642
num_examples: 972
- name: dac_24k
num_bytes: 446823802
num_examples: 972
- name: dac_44k
num_bytes: 145647658
num_examples: 972
- name: encodec_24k_12bps
num_bytes: 174041722
num_examples: 972
- name: encodec_24k_1_5bps
num_bytes: 21795418
num_examples: 972
- name: encodec_24k_24bps
num_bytes: 348037498
num_examples: 972
- name: encodec_24k_3bps
num_bytes: 43544890
num_examples: 972
- name: encodec_24k_6bps
num_bytes: 87043834
num_examples: 972
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 232330618
num_examples: 972
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 232330618
num_examples: 972
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 232081786
num_examples: 972
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 116126074
num_examples: 972
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 232081786
num_examples: 972
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 116126074
num_examples: 972
- name: speech_tokenizer_16k
num_bytes: 58054906
num_examples: 972
download_size: 311913132
dataset_size: 2789871454
---
# Dataset Card for "vox_lingua_top10_unit"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个文件对应不同的分割(split)和路径(path)。
数据文件列表
- academicodec_hifi_16k_320d
- 路径:
data/academicodec_hifi_16k_320d-*
- 路径:
- academicodec_hifi_16k_320d_large_uni
- 路径:
data/academicodec_hifi_16k_320d_large_uni-*
- 路径:
- academicodec_hifi_24k_320d
- 路径:
data/academicodec_hifi_24k_320d-*
- 路径:
- audiodec_24k_320d
- 路径:
data/audiodec_24k_320d-*
- 路径:
- dac_16k
- 路径:
data/dac_16k-*
- 路径:
- dac_24k
- 路径:
data/dac_24k-*
- 路径:
- dac_44k
- 路径:
data/dac_44k-*
- 路径:
- encodec_24k_12bps
- 路径:
data/encodec_24k_12bps-*
- 路径:
- encodec_24k_1_5bps
- 路径:
data/encodec_24k_1_5bps-*
- 路径:
- encodec_24k_24bps
- 路径:
data/encodec_24k_24bps-*
- 路径:
- encodec_24k_3bps
- 路径:
data/encodec_24k_3bps-*
- 路径:
- encodec_24k_6bps
- 路径:
data/encodec_24k_6bps-*
- 路径:
- funcodec_en_libritts_16k_gr1nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_gr8nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds320
- 路径:
data/funcodec_en_libritts_16k_nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds640
- 路径:
data/funcodec_en_libritts_16k_nq32ds640-*
- 路径:
- funcodec_zh_en_16k_nq32ds320
- 路径:
data/funcodec_zh_en_16k_nq32ds320-*
- 路径:
- funcodec_zh_en_16k_nq32ds640
- 路径:
data/funcodec_zh_en_16k_nq32ds640-*
- 路径:
- speech_tokenizer_16k
- 路径:
data/speech_tokenizer_16k-*
- 路径:
数据集信息
特征
- id:字符串类型
- unit:序列类型,包含整数64位
分割
- academicodec_hifi_16k_320d
- 字节数:29050426
- 样本数:972
- academicodec_hifi_16k_320d_large_uni
- 字节数:29050426
- 样本数:972
- academicodec_hifi_24k_320d
- 字节数:43544890
- 样本数:972
- audiodec_24k_320d
- 字节数:92891386
- 样本数:972
- dac_16k
- 字节数:109267642
- 样本数:972
- dac_24k
- 字节数:446823802
- 样本数:972
- dac_44k
- 字节数:145647658
- 样本数:972
- encodec_24k_12bps
- 字节数:174041722
- 样本数:972
- encodec_24k_1_5bps
- 字节数:21795418
- 样本数:972
- encodec_24k_24bps
- 字节数:348037498
- 样本数:972
- encodec_24k_3bps
- 字节数:43544890
- 样本数:972
- encodec_24k_6bps
- 字节数:87043834
- 样本数:972
- funcodec_en_libritts_16k_gr1nq32ds320
- 字节数:232330618
- 样本数:972
- funcodec_en_libritts_16k_gr8nq32ds320
- 字节数:232330618
- 样本数:972
- funcodec_en_libritts_16k_nq32ds320
- 字节数:232081786
- 样本数:972
- funcodec_en_libritts_16k_nq32ds640
- 字节数:116126074
- 样本数:972
- funcodec_zh_en_16k_nq32ds320
- 字节数:232081786
- 样本数:972
- funcodec_zh_en_16k_nq32ds640
- 字节数:116126074
- 样本数:972
- speech_tokenizer_16k
- 字节数:58054906
- 样本数:972
数据集大小
- 下载大小:311913132字节
- 数据集大小:2789871454字节



