Codec-SUPERB/libricount_unit
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/libricount_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 45943560
num_examples: 5720
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 45943560
num_examples: 5720
- name: academicodec_hifi_24k_320d
num_bytes: 68823560
num_examples: 5720
- name: audiodec_24k_320d
num_bytes: 146707080
num_examples: 5720
- name: dac_16k
num_bytes: 137646600
num_examples: 5720
- name: dac_24k
num_bytes: 549944200
num_examples: 5720
- name: dac_44k
num_bytes: 177801000
num_examples: 5720
- name: encodec_24k_12bps
num_bytes: 275018120
num_examples: 5720
- name: encodec_24k_1_5bps
num_bytes: 34457800
num_examples: 5720
- name: encodec_24k_24bps
num_bytes: 549944200
num_examples: 5720
- name: encodec_24k_3bps
num_bytes: 68823560
num_examples: 5720
- name: encodec_24k_6bps
num_bytes: 137555080
num_examples: 5720
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 368368520
num_examples: 5720
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 368368520
num_examples: 5720
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 366904200
num_examples: 5720
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 183864200
num_examples: 5720
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 366904200
num_examples: 5720
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 183864200
num_examples: 5720
- name: speech_tokenizer_16k
num_bytes: 91795080
num_examples: 5720
download_size: 659652935
dataset_size: 4168677240
---
# Dataset Card for "libricount_unit"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
配置项:
- 配置名称: default
数据文件:
- 数据子集: academicodec_hifi_16k_320d
数据路径: data/academicodec_hifi_16k_320d-*
- 数据子集: academicodec_hifi_16k_320d_large_uni
数据路径: data/academicodec_hifi_16k_320d_large_uni-*
- 数据子集: academicodec_hifi_24k_320d
数据路径: data/academicodec_hifi_24k_320d-*
- 数据子集: audiodec_24k_320d
数据路径: data/audiodec_24k_320d-*
- 数据子集: dac_16k
数据路径: data/dac_16k-*
- 数据子集: dac_24k
数据路径: data/dac_24k-*
- 数据子集: dac_44k
数据路径: data/dac_44k-*
- 数据子集: encodec_24k_12bps
数据路径: data/encodec_24k_12bps-*
- 数据子集: encodec_24k_1_5bps
数据路径: data/encodec_24k_1_5bps-*
- 数据子集: encodec_24k_24bps
数据路径: data/encodec_24k_24bps-*
- 数据子集: encodec_24k_3bps
数据路径: data/encodec_24k_3bps-*
- 数据子集: encodec_24k_6bps
数据路径: data/encodec_24k_6bps-*
- 数据子集: funcodec_en_libritts_16k_gr1nq32ds320
数据路径: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 数据子集: funcodec_en_libritts_16k_gr8nq32ds320
数据路径: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 数据子集: funcodec_en_libritts_16k_nq32ds320
数据路径: data/funcodec_en_libritts_16k_nq32ds320-*
- 数据子集: funcodec_en_libritts_16k_nq32ds640
数据路径: data/funcodec_en_libritts_16k_nq32ds640-*
- 数据子集: funcodec_zh_en_16k_nq32ds320
数据路径: data/funcodec_zh_en_16k_nq32ds320-*
- 数据子集: funcodec_zh_en_16k_nq32ds640
数据路径: data/funcodec_zh_en_16k_nq32ds640-*
- 数据子集: speech_tokenizer_16k
数据路径: data/speech_tokenizer_16k-*
数据集信息:
特征集:
- 特征名: id
数据类型: 字符串
- 特征名: unit
序列:
序列元素类型: 64位整数
数据子集列表:
- 子集名称: academicodec_hifi_16k_320d
字节总数: 45943560
样本数量: 5720
- 子集名称: academicodec_hifi_16k_320d_large_uni
字节总数: 45943560
样本数量: 5720
- 子集名称: academicodec_hifi_24k_320d
字节总数: 68823560
样本数量: 5720
- 子集名称: audiodec_24k_320d
字节总数: 146707080
样本数量: 5720
- 子集名称: dac_16k
字节总数: 137646600
样本数量: 5720
- 子集名称: dac_24k
字节总数: 549944200
样本数量: 5720
- 子集名称: dac_44k
字节总数: 177801000
样本数量: 5720
- 子集名称: encodec_24k_12bps
字节总数: 275018120
样本数量: 5720
- 子集名称: encodec_24k_1_5bps
字节总数: 34457800
样本数量: 5720
- 子集名称: encodec_24k_24bps
字节总数: 549944200
样本数量: 5720
- 子集名称: encodec_24k_3bps
字节总数: 68823560
样本数量: 5720
- 子集名称: encodec_24k_6bps
字节总数: 137555080
样本数量: 5720
- 子集名称: funcodec_en_libritts_16k_gr1nq32ds320
字节总数: 368368520
样本数量: 5720
- 子集名称: funcodec_en_libritts_16k_gr8nq32ds320
字节总数: 368368520
样本数量: 5720
- 子集名称: funcodec_en_libritts_16k_nq32ds320
字节总数: 366904200
样本数量: 5720
- 子集名称: funcodec_en_libritts_16k_nq32ds640
字节总数: 183864200
样本数量: 5720
- 子集名称: funcodec_zh_en_16k_nq32ds320
字节总数: 366904200
样本数量: 5720
- 子集名称: funcodec_zh_en_16k_nq32ds640
字节总数: 183864200
样本数量: 5720
- 子集名称: speech_tokenizer_16k
字节总数: 91795080
样本数量: 5720
下载总大小: 659652935
数据集总大小: 4168677240
---
# 「libricount_unit」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个文件对应不同的分割(split)和路径(path)。
数据文件列表
- academicodec_hifi_16k_320d:路径为
data/academicodec_hifi_16k_320d-* - academicodec_hifi_16k_320d_large_uni:路径为
data/academicodec_hifi_16k_320d_large_uni-* - academicodec_hifi_24k_320d:路径为
data/academicodec_hifi_24k_320d-* - audiodec_24k_320d:路径为
data/audiodec_24k_320d-* - dac_16k:路径为
data/dac_16k-* - dac_24k:路径为
data/dac_24k-* - dac_44k:路径为
data/dac_44k-* - encodec_24k_12bps:路径为
data/encodec_24k_12bps-* - encodec_24k_1_5bps:路径为
data/encodec_24k_1_5bps-* - encodec_24k_24bps:路径为
data/encodec_24k_24bps-* - encodec_24k_3bps:路径为
data/encodec_24k_3bps-* - encodec_24k_6bps:路径为
data/encodec_24k_6bps-* - funcodec_en_libritts_16k_gr1nq32ds320:路径为
data/funcodec_en_libritts_16k_gr1nq32ds320-* - funcodec_en_libritts_16k_gr8nq32ds320:路径为
data/funcodec_en_libritts_16k_gr8nq32ds320-* - funcodec_en_libritts_16k_nq32ds320:路径为
data/funcodec_en_libritts_16k_nq32ds320-* - funcodec_en_libritts_16k_nq32ds640:路径为
data/funcodec_en_libritts_16k_nq32ds640-* - funcodec_zh_en_16k_nq32ds320:路径为
data/funcodec_zh_en_16k_nq32ds320-* - funcodec_zh_en_16k_nq32ds640:路径为
data/funcodec_zh_en_16k_nq32ds640-* - speech_tokenizer_16k:路径为
data/speech_tokenizer_16k-*
数据集信息
- 特征:
- id:数据类型为字符串(string)
- unit:序列类型,包含整数64位(int64)
分割信息
- academicodec_hifi_16k_320d:字节数为 45943560,样本数为 5720
- academicodec_hifi_16k_320d_large_uni:字节数为 45943560,样本数为 5720
- academicodec_hifi_24k_320d:字节数为 68823560,样本数为 5720
- audiodec_24k_320d:字节数为 146707080,样本数为 5720
- dac_16k:字节数为 137646600,样本数为 5720
- dac_24k:字节数为 549944200,样本数为 5720
- dac_44k:字节数为 177801000,样本数为 5720
- encodec_24k_12bps:字节数为 275018120,样本数为 5720
- encodec_24k_1_5bps:字节数为 34457800,样本数为 5720
- encodec_24k_24bps:字节数为 549944200,样本数为 5720
- encodec_24k_3bps:字节数为 68823560,样本数为 5720
- encodec_24k_6bps:字节数为 137555080,样本数为 5720
- funcodec_en_libritts_16k_gr1nq32ds320:字节数为 368368520,样本数为 5720
- funcodec_en_libritts_16k_gr8nq32ds320:字节数为 368368520,样本数为 5720
- funcodec_en_libritts_16k_nq32ds320:字节数为 366904200,样本数为 5720
- funcodec_en_libritts_16k_nq32ds640:字节数为 183864200,样本数为 5720
- funcodec_zh_en_16k_nq32ds320:字节数为 366904200,样本数为 5720
- funcodec_zh_en_16k_nq32ds640:字节数为 183864200,样本数为 5720
- speech_tokenizer_16k:字节数为 91795080,样本数为 5720
数据集大小
- 下载大小:659652935 字节
- 数据集大小:4168677240 字节



