Codec-SUPERB/librispeech_asr_dummy_unit
收藏Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/librispeech_asr_dummy_unit
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: unit
sequence:
sequence: int64
splits:
- name: academicodec_hifi_16k_320d
num_bytes: 535736
num_examples: 63
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 535736
num_examples: 63
- name: academicodec_hifi_24k_320d
num_bytes: 802552
num_examples: 63
- name: audiodec_24k_320d
num_bytes: 1713544
num_examples: 63
- name: dac_16k
num_bytes: 2089080
num_examples: 63
- name: dac_24k
num_bytes: 8212840
num_examples: 63
- name: dac_44k
num_bytes: 2641068
num_examples: 63
- name: encodec_24k_12bps
num_bytes: 3212072
num_examples: 63
- name: encodec_24k_1_5bps
num_bytes: 402832
num_examples: 63
- name: encodec_24k_24bps
num_bytes: 6422632
num_examples: 63
- name: encodec_24k_3bps
num_bytes: 804152
num_examples: 63
- name: encodec_24k_6bps
num_bytes: 1606792
num_examples: 63
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 4291432
num_examples: 63
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 4291432
num_examples: 63
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 4285032
num_examples: 63
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 2152040
num_examples: 63
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 4285032
num_examples: 63
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 2152040
num_examples: 63
- name: speech_tokenizer_16k
num_bytes: 1072392
num_examples: 63
download_size: 7889841
dataset_size: 51508436
configs:
- config_name: default
data_files:
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
---
数据集信息:
特征字段:
- 字段名:id,数据类型:字符串
- 字段名:unit,数据类型:二维64位整数序列
数据划分:
- 划分名称:academicodec_hifi_16k_320d,字节大小:535736,样本数量:63
- 划分名称:academicodec_hifi_16k_320d_large_uni,字节大小:535736,样本数量:63
- 划分名称:academicodec_hifi_24k_320d,字节大小:802552,样本数量:63
- 划分名称:audiodec_24k_320d,字节大小:1713544,样本数量:63
- 划分名称:dac_16k,字节大小:2089080,样本数量:63
- 划分名称:dac_24k,字节大小:8212840,样本数量:63
- 划分名称:dac_44k,字节大小:2641068,样本数量:63
- 划分名称:encodec_24k_12bps,字节大小:3212072,样本数量:63
- 划分名称:encodec_24k_1_5bps,字节大小:402832,样本数量:63
- 划分名称:encodec_24k_24bps,字节大小:6422632,样本数量:63
- 划分名称:encodec_24k_3bps,字节大小:804152,样本数量:63
- 划分名称:encodec_24k_6bps,字节大小:1606792,样本数量:63
- 划分名称:funcodec_en_libritts_16k_gr1nq32ds320,字节大小:4291432,样本数量:63
- 划分名称:funcodec_en_libritts_16k_gr8nq32ds320,字节大小:4291432,样本数量:63
- 划分名称:funcodec_en_libritts_16k_nq32ds320,字节大小:4285032,样本数量:63
- 划分名称:funcodec_en_libritts_16k_nq32ds640,字节大小:2152040,样本数量:63
- 划分名称:funcodec_zh_en_16k_nq32ds320,字节大小:4285032,样本数量:63
- 划分名称:funcodec_zh_en_16k_nq32ds640,字节大小:2152040,样本数量:63
- 划分名称:speech_tokenizer_16k,字节大小:1072392,样本数量:63
总下载大小:7889841字节,数据集总大小:51508436字节
配置项:
- 配置名称:default,数据文件:
- 对应数据划分:academicodec_hifi_16k_320d,文件路径:data/academicodec_hifi_16k_320d-*
- 对应数据划分:academicodec_hifi_16k_320d_large_uni,文件路径:data/academicodec_hifi_16k_320d_large_uni-*
- 对应数据划分:academicodec_hifi_24k_320d,文件路径:data/academicodec_hifi_24k_320d-*
- 对应数据划分:audiodec_24k_320d,文件路径:data/audiodec_24k_320d-*
- 对应数据划分:dac_16k,文件路径:data/dac_16k-*
- 对应数据划分:dac_24k,文件路径:data/dac_24k-*
- 对应数据划分:dac_44k,文件路径:data/dac_44k-*
- 对应数据划分:encodec_24k_12bps,文件路径:data/encodec_24k_12bps-*
- 对应数据划分:encodec_24k_1_5bps,文件路径:data/encodec_24k_1_5bps-*
- 对应数据划分:encodec_24k_24bps,文件路径:data/encodec_24k_24bps-*
- 对应数据划分:encodec_24k_3bps,文件路径:data/encodec_24k_3bps-*
- 对应数据划分:encodec_24k_6bps,文件路径:data/encodec_24k_6bps-*
- 对应数据划分:funcodec_en_libritts_16k_gr1nq32ds320,文件路径:data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 对应数据划分:funcodec_en_libritts_16k_gr8nq32ds320,文件路径:data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 对应数据划分:funcodec_en_libritts_16k_nq32ds320,文件路径:data/funcodec_en_libritts_16k_nq32ds320-*
- 对应数据划分:funcodec_en_libritts_16k_nq32ds640,文件路径:data/funcodec_en_libritts_16k_nq32ds640-*
- 对应数据划分:funcodec_zh_en_16k_nq32ds320,文件路径:data/funcodec_zh_en_16k_nq32ds320-*
- 对应数据划分:funcodec_zh_en_16k_nq32ds640,文件路径:data/funcodec_zh_en_16k_nq32ds640-*
- 对应数据划分:speech_tokenizer_16k,文件路径:data/speech_tokenizer_16k-*
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- unit: 包含一个序列,序列类型为int64。
数据集分割
数据集包含多个分割,每个分割具有不同的名称、字节数和示例数量:
- academicodec_hifi_16k_320d: 535736字节,63个示例。
- academicodec_hifi_16k_320d_large_uni: 535736字节,63个示例。
- academicodec_hifi_24k_320d: 802552字节,63个示例。
- audiodec_24k_320d: 1713544字节,63个示例。
- dac_16k: 2089080字节,63个示例。
- dac_24k: 8212840字节,63个示例。
- dac_44k: 2641068字节,63个示例。
- encodec_24k_12bps: 3212072字节,63个示例。
- encodec_24k_1_5bps: 402832字节,63个示例。
- encodec_24k_24bps: 6422632字节,63个示例。
- encodec_24k_3bps: 804152字节,63个示例。
- encodec_24k_6bps: 1606792字节,63个示例。
- funcodec_en_libritts_16k_gr1nq32ds320: 4291432字节,63个示例。
- funcodec_en_libritts_16k_gr8nq32ds320: 4291432字节,63个示例。
- funcodec_en_libritts_16k_nq32ds320: 4285032字节,63个示例。
- funcodec_en_libritts_16k_nq32ds640: 2152040字节,63个示例。
- funcodec_zh_en_16k_nq32ds320: 4285032字节,63个示例。
- funcodec_zh_en_16k_nq32ds640: 2152040字节,63个示例。
- speech_tokenizer_16k: 1072392字节,63个示例。
数据集大小
- 下载大小: 7889841字节。
- 数据集大小: 51508436字节。
配置
- 默认配置: 包含多个数据文件,每个文件对应一个分割,路径格式为
data/分割名称-*。



