Codec-SUPERB/snips_test_valid_unit
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/snips_test_valid_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 104890744
num_examples: 22400
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 104890744
num_examples: 22400
- name: academicodec_hifi_24k_320d
num_bytes: 156911640
num_examples: 22400
- name: audiodec_24k_320d
num_bytes: 335215352
num_examples: 22400
- name: dac_16k
num_bytes: 329541496
num_examples: 22400
- name: dac_24k
num_bytes: 1316239608
num_examples: 22400
- name: dac_44k
num_bytes: 425937832
num_examples: 22400
- name: encodec_24k_12bps
num_bytes: 627940216
num_examples: 22400
- name: encodec_24k_1_5bps
num_bytes: 79225672
num_examples: 22400
- name: encodec_24k_24bps
num_bytes: 1255042552
num_examples: 22400
- name: encodec_24k_3bps
num_bytes: 157613464
num_examples: 22400
- name: encodec_24k_6bps
num_bytes: 314389048
num_examples: 22400
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 838995192
num_examples: 22400
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 838995192
num_examples: 22400
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 838875384
num_examples: 22400
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 422686712
num_examples: 22400
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 838875384
num_examples: 22400
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 422686712
num_examples: 22400
- name: speech_tokenizer_16k
num_bytes: 210347256
num_examples: 22400
download_size: 1509323889
dataset_size: 9619300200
---
# Dataset Card for "snips_test_valid_unit"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个文件对应不同的分割和路径。
数据文件列表
- academicodec_hifi_16k_320d
- 路径:
data/academicodec_hifi_16k_320d-*
- 路径:
- academicodec_hifi_16k_320d_large_uni
- 路径:
data/academicodec_hifi_16k_320d_large_uni-*
- 路径:
- academicodec_hifi_24k_320d
- 路径:
data/academicodec_hifi_24k_320d-*
- 路径:
- audiodec_24k_320d
- 路径:
data/audiodec_24k_320d-*
- 路径:
- dac_16k
- 路径:
data/dac_16k-*
- 路径:
- dac_24k
- 路径:
data/dac_24k-*
- 路径:
- dac_44k
- 路径:
data/dac_44k-*
- 路径:
- encodec_24k_12bps
- 路径:
data/encodec_24k_12bps-*
- 路径:
- encodec_24k_1_5bps
- 路径:
data/encodec_24k_1_5bps-*
- 路径:
- encodec_24k_24bps
- 路径:
data/encodec_24k_24bps-*
- 路径:
- encodec_24k_3bps
- 路径:
data/encodec_24k_3bps-*
- 路径:
- encodec_24k_6bps
- 路径:
data/encodec_24k_6bps-*
- 路径:
- funcodec_en_libritts_16k_gr1nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_gr8nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds320
- 路径:
data/funcodec_en_libritts_16k_nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds640
- 路径:
data/funcodec_en_libritts_16k_nq32ds640-*
- 路径:
- funcodec_zh_en_16k_nq32ds320
- 路径:
data/funcodec_zh_en_16k_nq32ds320-*
- 路径:
- funcodec_zh_en_16k_nq32ds640
- 路径:
data/funcodec_zh_en_16k_nq32ds640-*
- 路径:
- speech_tokenizer_16k
- 路径:
data/speech_tokenizer_16k-*
- 路径:
数据集信息
特征
- id:字符串类型
- unit:序列类型,包含整数64位
分割信息
- academicodec_hifi_16k_320d
- 字节数:104890744
- 样本数:22400
- academicodec_hifi_16k_320d_large_uni
- 字节数:104890744
- 样本数:22400
- academicodec_hifi_24k_320d
- 字节数:156911640
- 样本数:22400
- audiodec_24k_320d
- 字节数:335215352
- 样本数:22400
- dac_16k
- 字节数:329541496
- 样本数:22400
- dac_24k
- 字节数:1316239608
- 样本数:22400
- dac_44k
- 字节数:425937832
- 样本数:22400
- encodec_24k_12bps
- 字节数:627940216
- 样本数:22400
- encodec_24k_1_5bps
- 字节数:79225672
- 样本数:22400
- encodec_24k_24bps
- 字节数:1255042552
- 样本数:22400
- encodec_24k_3bps
- 字节数:157613464
- 样本数:22400
- encodec_24k_6bps
- 字节数:314389048
- 样本数:22400
- funcodec_en_libritts_16k_gr1nq32ds320
- 字节数:838995192
- 样本数:22400
- funcodec_en_libritts_16k_gr8nq32ds320
- 字节数:838995192
- 样本数:22400
- funcodec_en_libritts_16k_nq32ds320
- 字节数:838875384
- 样本数:22400
- funcodec_en_libritts_16k_nq32ds640
- 字节数:422686712
- 样本数:22400
- funcodec_zh_en_16k_nq32ds320
- 字节数:838875384
- 样本数:22400
- funcodec_zh_en_16k_nq32ds640
- 字节数:422686712
- 样本数:22400
- speech_tokenizer_16k
- 字节数:210347256
- 样本数:22400
数据集大小
- 下载大小:1509323889字节
- 数据集大小:9619300200字节



