Codec-SUPERB/fluent_speech_commands_unit
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/fluent_speech_commands_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 113230526
num_examples: 30043
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 113230526
num_examples: 30043
- name: academicodec_hifi_24k_320d
num_bytes: 168731838
num_examples: 30043
- name: audiodec_24k_320d
num_bytes: 358989102
num_examples: 30043
- name: dac_16k
num_bytes: 339147198
num_examples: 30043
- name: dac_24k
num_bytes: 1346105166
num_examples: 30043
- name: dac_44k
num_bytes: 436126386
num_examples: 30043
- name: encodec_24k_12bps
num_bytes: 671261198
num_examples: 30043
- name: encodec_24k_1_5bps
num_bytes: 85988566
num_examples: 30043
- name: encodec_24k_24bps
num_bytes: 1340144206
num_examples: 30043
- name: encodec_24k_3bps
num_bytes: 169598942
num_examples: 30043
- name: encodec_24k_6bps
num_bytes: 336819694
num_examples: 30043
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 896887886
num_examples: 30043
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 896887886
num_examples: 30043
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 896513102
num_examples: 30043
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 453298510
num_examples: 30043
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 896513102
num_examples: 30043
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 453298510
num_examples: 30043
- name: speech_tokenizer_16k
num_bytes: 225911918
num_examples: 30043
download_size: 1566492443
dataset_size: 10198684262
---
# Dataset Card for "fluent_speech_commands_unit"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:包含多个数据文件,每个数据文件对应不同的分割(split)和路径(path)。
数据文件列表
- academicodec_hifi_16k_320d
- 路径:
data/academicodec_hifi_16k_320d-*
- 路径:
- academicodec_hifi_16k_320d_large_uni
- 路径:
data/academicodec_hifi_16k_320d_large_uni-*
- 路径:
- academicodec_hifi_24k_320d
- 路径:
data/academicodec_hifi_24k_320d-*
- 路径:
- audiodec_24k_320d
- 路径:
data/audiodec_24k_320d-*
- 路径:
- dac_16k
- 路径:
data/dac_16k-*
- 路径:
- dac_24k
- 路径:
data/dac_24k-*
- 路径:
- dac_44k
- 路径:
data/dac_44k-*
- 路径:
- encodec_24k_12bps
- 路径:
data/encodec_24k_12bps-*
- 路径:
- encodec_24k_1_5bps
- 路径:
data/encodec_24k_1_5bps-*
- 路径:
- encodec_24k_24bps
- 路径:
data/encodec_24k_24bps-*
- 路径:
- encodec_24k_3bps
- 路径:
data/encodec_24k_3bps-*
- 路径:
- encodec_24k_6bps
- 路径:
data/encodec_24k_6bps-*
- 路径:
- funcodec_en_libritts_16k_gr1nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_gr8nq32ds320
- 路径:
data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds320
- 路径:
data/funcodec_en_libritts_16k_nq32ds320-*
- 路径:
- funcodec_en_libritts_16k_nq32ds640
- 路径:
data/funcodec_en_libritts_16k_nq32ds640-*
- 路径:
- funcodec_zh_en_16k_nq32ds320
- 路径:
data/funcodec_zh_en_16k_nq32ds320-*
- 路径:
- funcodec_zh_en_16k_nq32ds640
- 路径:
data/funcodec_zh_en_16k_nq32ds640-*
- 路径:
- speech_tokenizer_16k
- 路径:
data/speech_tokenizer_16k-*
- 路径:
数据集信息
- 特征:
id:字符串类型unit:序列类型,包含整数64位
分割信息
- academicodec_hifi_16k_320d
- 字节数:113230526
- 样本数:30043
- academicodec_hifi_16k_320d_large_uni
- 字节数:113230526
- 样本数:30043
- academicodec_hifi_24k_320d
- 字节数:168731838
- 样本数:30043
- audiodec_24k_320d
- 字节数:358989102
- 样本数:30043
- dac_16k
- 字节数:339147198
- 样本数:30043
- dac_24k
- 字节数:1346105166
- 样本数:30043
- dac_44k
- 字节数:436126386
- 样本数:30043
- encodec_24k_12bps
- 字节数:671261198
- 样本数:30043
- encodec_24k_1_5bps
- 字节数:85988566
- 样本数:30043
- encodec_24k_24bps
- 字节数:1340144206
- 样本数:30043
- encodec_24k_3bps
- 字节数:169598942
- 样本数:30043
- encodec_24k_6bps
- 字节数:336819694
- 样本数:30043
- funcodec_en_libritts_16k_gr1nq32ds320
- 字节数:896887886
- 样本数:30043
- funcodec_en_libritts_16k_gr8nq32ds320
- 字节数:896887886
- 样本数:30043
- funcodec_en_libritts_16k_nq32ds320
- 字节数:896513102
- 样本数:30043
- funcodec_en_libritts_16k_nq32ds640
- 字节数:453298510
- 样本数:30043
- funcodec_zh_en_16k_nq32ds320
- 字节数:896513102
- 样本数:30043
- funcodec_zh_en_16k_nq32ds640
- 字节数:453298510
- 样本数:30043
- speech_tokenizer_16k
- 字节数:225911918
- 样本数:30043
数据集大小
- 下载大小:1566492443 字节
- 数据集大小:10198684262 字节



