Codec-SUPERB/snips_test_valid_subset_synth
收藏Hugging Face2024-02-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/snips_test_valid_subset_synth
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: original
path: data/original-*
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: id
dtype: string
splits:
- name: original
num_bytes: 297529851.71428573
num_examples: 3200
- name: academicodec_hifi_16k_320d
num_bytes: 296644414.62857145
num_examples: 3200
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 296644414.62857145
num_examples: 3200
- name: academicodec_hifi_24k_320d
num_bytes: 445275546.05714285
num_examples: 3200
- name: audiodec_24k_320d
num_bytes: 447241488.9142857
num_examples: 3200
- name: dac_16k
num_bytes: 297646672.05714285
num_examples: 3200
- name: dac_24k
num_bytes: 446284308.3428571
num_examples: 3200
- name: dac_44k
num_bytes: 819734034.3428571
num_examples: 3200
- name: encodec_24k_12bps
num_bytes: 446284308.3428571
num_examples: 3200
- name: encodec_24k_1_5bps
num_bytes: 446284308.3428571
num_examples: 3200
- name: encodec_24k_24bps
num_bytes: 446284308.3428571
num_examples: 3200
- name: encodec_24k_3bps
num_bytes: 446284308.3428571
num_examples: 3200
- name: encodec_24k_6bps
num_bytes: 446284308.3428571
num_examples: 3200
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 297401252.9142857
num_examples: 3200
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 297401252.9142857
num_examples: 3200
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 297646672.05714285
num_examples: 3200
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 297646672.05714285
num_examples: 3200
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 297646672.05714285
num_examples: 3200
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 297646672.05714285
num_examples: 3200
- name: speech_tokenizer_16k
num_bytes: 298649626.05714285
num_examples: 3200
download_size: 7636771821
dataset_size: 7662461092.514289
---
# Dataset Card for "snips_test_valid_subset_synth"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称: default
数据文件:
- 拆分集: original
路径: data/original-*
- 拆分集: academicodec_hifi_16k_320d
路径: data/academicodec_hifi_16k_320d-*
- 拆分集: academicodec_hifi_16k_320d_large_uni
路径: data/academicodec_hifi_16k_320d_large_uni-*
- 拆分集: academicodec_hifi_24k_320d
路径: data/academicodec_hifi_24k_320d-*
- 拆分集: audiodec_24k_320d
路径: data/audiodec_24k_320d-*
- 拆分集: dac_16k
路径: data/dac_16k-*
- 拆分集: dac_24k
路径: data/dac_24k-*
- 拆分集: dac_44k
路径: data/dac_44k-*
- 拆分集: encodec_24k_12bps
路径: data/encodec_24k_12bps-*
- 拆分集: encodec_24k_1_5bps
路径: data/encodec_24k_1_5bps-*
- 拆分集: encodec_24k_24bps
路径: data/encodec_24k_24bps-*
- 拆分集: encodec_24k_3bps
路径: data/encodec_24k_3bps-*
- 拆分集: encodec_24k_6bps
路径: data/encodec_24k_6bps-*
- 拆分集: funcodec_en_libritts_16k_gr1nq32ds320
路径: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 拆分集: funcodec_en_libritts_16k_gr8nq32ds320
路径: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 拆分集: funcodec_en_libritts_16k_nq32ds320
路径: data/funcodec_en_libritts_16k_nq32ds320-*
- 拆分集: funcodec_en_libritts_16k_nq32ds640
路径: data/funcodec_en_libritts_16k_nq32ds640-*
- 拆分集: funcodec_zh_en_16k_nq32ds320
路径: data/funcodec_zh_en_16k_nq32ds320-*
- 拆分集: funcodec_zh_en_16k_nq32ds640
路径: data/funcodec_zh_en_16k_nq32ds640-*
- 拆分集: speech_tokenizer_16k
路径: data/speech_tokenizer_16k-*
数据集信息:
特征:
- 名称: audio
数据类型:
音频:
采样率: 16000
- 名称: id
数据类型: 字符串
拆分集:
- 名称: original
字节数: 297529851.71428573
样本数: 3200
- 名称: academicodec_hifi_16k_320d
字节数: 296644414.62857145
样本数: 3200
- 名称: academicodec_hifi_16k_320d_large_uni
字节数: 296644414.62857145
样本数: 3200
- 名称: academicodec_hifi_24k_320d
字节数: 445275546.05714285
样本数: 3200
- 名称: audiodec_24k_320d
字节数: 447241488.9142857
样本数: 3200
- 名称: dac_16k
字节数: 297646672.05714285
样本数: 3200
- 名称: dac_24k
字节数: 446284308.3428571
样本数: 3200
- 名称: dac_44k
字节数: 819734034.3428571
样本数: 3200
- 名称: encodec_24k_12bps
字节数: 446284308.3428571
样本数: 3200
- 名称: encodec_24k_1_5bps
字节数: 446284308.3428571
样本数: 3200
- 名称: encodec_24k_24bps
字节数: 446284308.3428571
样本数: 3200
- 名称: encodec_24k_3bps
字节数: 446284308.3428571
样本数: 3200
- 名称: encodec_24k_6bps
字节数: 446284308.3428571
样本数: 3200
- 名称: funcodec_en_libritts_16k_gr1nq32ds320
字节数: 297401252.9142857
样本数: 3200
- 名称: funcodec_en_libritts_16k_gr8nq32ds320
字节数: 297401252.9142857
样本数: 3200
- 名称: funcodec_en_libritts_16k_nq32ds320
字节数: 297646672.05714285
样本数: 3200
- 名称: funcodec_en_libritts_16k_nq32ds640
字节数: 297646672.05714285
样本数: 3200
- 名称: funcodec_zh_en_16k_nq32ds320
字节数: 297646672.05714285
样本数: 3200
- 名称: funcodec_zh_en_16k_nq32ds640
字节数: 297646672.05714285
样本数: 3200
- 名称: speech_tokenizer_16k
字节数: 298649626.05714285
样本数: 3200
下载总大小: 7636771821
数据集总大小: 7662461092.514289
---
# 数据集卡片:"snips_test_valid_subset_synth"
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个文件对应不同的分割和路径。
数据文件列表
- original:路径为
data/original-* - academicodec_hifi_16k_320d:路径为
data/academicodec_hifi_16k_320d-* - academicodec_hifi_16k_320d_large_uni:路径为
data/academicodec_hifi_16k_320d_large_uni-* - academicodec_hifi_24k_320d:路径为
data/academicodec_hifi_24k_320d-* - audiodec_24k_320d:路径为
data/audiodec_24k_320d-* - dac_16k:路径为
data/dac_16k-* - dac_24k:路径为
data/dac_24k-* - dac_44k:路径为
data/dac_44k-* - encodec_24k_12bps:路径为
data/encodec_24k_12bps-* - encodec_24k_1_5bps:路径为
data/encodec_24k_1_5bps-* - encodec_24k_24bps:路径为
data/encodec_24k_24bps-* - encodec_24k_3bps:路径为
data/encodec_24k_3bps-* - encodec_24k_6bps:路径为
data/encodec_24k_6bps-* - funcodec_en_libritts_16k_gr1nq32ds320:路径为
data/funcodec_en_libritts_16k_gr1nq32ds320-* - funcodec_en_libritts_16k_gr8nq32ds320:路径为
data/funcodec_en_libritts_16k_gr8nq32ds320-* - funcodec_en_libritts_16k_nq32ds320:路径为
data/funcodec_en_libritts_16k_nq32ds320-* - funcodec_en_libritts_16k_nq32ds640:路径为
data/funcodec_en_libritts_16k_nq32ds640-* - funcodec_zh_en_16k_nq32ds320:路径为
data/funcodec_zh_en_16k_nq32ds320-* - funcodec_zh_en_16k_nq32ds640:路径为
data/funcodec_zh_en_16k_nq32ds640-* - speech_tokenizer_16k:路径为
data/speech_tokenizer_16k-*
数据集信息
- 特征:
- audio:采样率为 16000 Hz
- id:字符串类型
分割信息
- original:字节数 297529851.71428573,样本数 3200
- academicodec_hifi_16k_320d:字节数 296644414.62857145,样本数 3200
- academicodec_hifi_16k_320d_large_uni:字节数 296644414.62857145,样本数 3200
- academicodec_hifi_24k_320d:字节数 445275546.05714285,样本数 3200
- audiodec_24k_320d:字节数 447241488.9142857,样本数 3200
- dac_16k:字节数 297646672.05714285,样本数 3200
- dac_24k:字节数 446284308.3428571,样本数 3200
- dac_44k:字节数 819734034.3428571,样本数 3200
- encodec_24k_12bps:字节数 446284308.3428571,样本数 3200
- encodec_24k_1_5bps:字节数 446284308.3428571,样本数 3200
- encodec_24k_24bps:字节数 446284308.3428571,样本数 3200
- encodec_24k_3bps:字节数 446284308.3428571,样本数 3200
- encodec_24k_6bps:字节数 446284308.3428571,样本数 3200
- funcodec_en_libritts_16k_gr1nq32ds320:字节数 297401252.9142857,样本数 3200
- funcodec_en_libritts_16k_gr8nq32ds320:字节数 297401252.9142857,样本数 3200
- funcodec_en_libritts_16k_nq32ds320:字节数 297646672.05714285,样本数 3200
- funcodec_en_libritts_16k_nq32ds640:字节数 297646672.05714285,样本数 3200
- funcodec_zh_en_16k_nq32ds320:字节数 297646672.05714285,样本数 3200
- funcodec_zh_en_16k_nq32ds640:字节数 297646672.05714285,样本数 3200
- speech_tokenizer_16k:字节数 298649626.05714285,样本数 3200
数据集大小
- 下载大小:7636771821 字节
- 数据集大小:7662461092.514289 字节



