CodecSR/fluent_speech_commands_male
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CodecSR/fluent_speech_commands_male
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: id
dtype: string
- name: gender
dtype: string
splits:
- name: original
num_bytes: 132705761.0
num_examples: 1817
- name: academicodec_hifi_16k_320d
num_bytes: 132229125.0
num_examples: 1817
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 132229125.0
num_examples: 1817
- name: academicodec_hifi_24k_320d
num_bytes: 198539525.0
num_examples: 1817
- name: audiodec_24k_320d
num_bytes: 199542165.0
num_examples: 1817
- name: dac_16k
num_bytes: 132767539.0
num_examples: 1817
- name: dac_24k
num_bytes: 199002413.0
num_examples: 1817
- name: dac_44k
num_bytes: 365415035.0
num_examples: 1817
- name: encodec_24k_12bps
num_bytes: 199002413.0
num_examples: 1817
- name: encodec_24k_1_5bps
num_bytes: 199002413.0
num_examples: 1817
- name: encodec_24k_24bps
num_bytes: 199002413.0
num_examples: 1817
- name: encodec_24k_3bps
num_bytes: 199002413.0
num_examples: 1817
- name: encodec_24k_6bps
num_bytes: 199002413.0
num_examples: 1817
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 132639413.0
num_examples: 1817
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 132639413.0
num_examples: 1817
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 132767539.0
num_examples: 1817
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 132767539.0
num_examples: 1817
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 132767539.0
num_examples: 1817
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 132767539.0
num_examples: 1817
- name: speech_tokenizer_16k
num_bytes: 133288325.0
num_examples: 1817
download_size: 2558737096
dataset_size: 3417080060.0
configs:
- config_name: default
data_files:
- split: original
path: data/original-*
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
---
数据集信息:
特征字段:
- 字段名:音频(audio),数据类型:音频格式,采样率:16000
- 字段名:id,数据类型:字符串
- 字段名:性别(gender),数据类型:字符串
数据划分:
- 划分名称:原始(original),字节数:132705761.0,样本数:1817
- 划分名称:academicodec_hifi_16k_320d,字节数:132229125.0,样本数:1817
- 划分名称:academicodec_hifi_16k_320d_large_uni,字节数:132229125.0,样本数:1817
- 划分名称:academicodec_hifi_24k_320d,字节数:198539525.0,样本数:1817
- 划分名称:audiodec_24k_320d,字节数:199542165.0,样本数:1817
- 划分名称:dac_16k,字节数:132767539.0,样本数:1817
- 划分名称:dac_24k,字节数:199002413.0,样本数:1817
- 划分名称:dac_44k,字节数:365415035.0,样本数:1817
- 划分名称:encodec_24k_12bps,字节数:199002413.0,样本数:1817
- 划分名称:encodec_24k_1_5bps,字节数:199002413.0,样本数:1817
- 划分名称:encodec_24k_24bps,字节数:199002413.0,样本数:1817
- 划分名称:encodec_24k_3bps,字节数:199002413.0,样本数:1817
- 划分名称:encodec_24k_6bps,字节数:199002413.0,样本数:1817
- 划分名称:funcodec_en_libritts_16k_gr1nq32ds320,字节数:132639413.0,样本数:1817
- 划分名称:funcodec_en_libritts_16k_gr8nq32ds320,字节数:132639413.0,样本数:1817
- 划分名称:funcodec_en_libritts_16k_nq32ds320,字节数:132767539.0,样本数:1817
- 划分名称:funcodec_en_libritts_16k_nq32ds640,字节数:132767539.0,样本数:1817
- 划分名称:funcodec_zh_en_16k_nq32ds320,字节数:132767539.0,样本数:1817
- 划分名称:funcodec_zh_en_16k_nq32ds640,字节数:132767539.0,样本数:1817
- 划分名称:speech_tokenizer_16k,字节数:133288325.0,样本数:1817
下载总大小:2558737096,数据集总占用大小:3417080060.0
配置项:
- 配置名称:default,数据文件:
- 划分:original,路径:data/original-*
- 划分:academicodec_hifi_16k_320d,路径:data/academicodec_hifi_16k_320d-*
- 划分:academicodec_hifi_16k_320d_large_uni,路径:data/academicodec_hifi_16k_320d_large_uni-*
- 划分:academicodec_hifi_24k_320d,路径:data/academicodec_hifi_24k_320d-*
- 划分:audiodec_24k_320d,路径:data/audiodec_24k_320d-*
- 划分:dac_16k,路径:data/dac_16k-*
- 划分:dac_24k,路径:data/dac_24k-*
- 划分:dac_44k,路径:data/dac_44k-*
- 划分:encodec_24k_12bps,路径:data/encodec_24k_12bps-*
- 划分:encodec_24k_1_5bps,路径:data/encodec_24k_1_5bps-*
- 划分:encodec_24k_24bps,路径:data/encodec_24k_24bps-*
- 划分:encodec_24k_3bps,路径:data/encodec_24k_3bps-*
- 划分:encodec_24k_6bps,路径:data/encodec_24k_6bps-*
- 划分:funcodec_en_libritts_16k_gr1nq32ds320,路径:data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 划分:funcodec_en_libritts_16k_gr8nq32ds320,路径:data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 划分:funcodec_en_libritts_16k_nq32ds320,路径:data/funcodec_en_libritts_16k_nq32ds320-*
- 划分:funcodec_en_libritts_16k_nq32ds640,路径:data/funcodec_en_libritts_16k_nq32ds640-*
- 划分:funcodec_zh_en_16k_nq32ds320,路径:data/funcodec_zh_en_16k_nq32ds320-*
- 划分:funcodec_zh_en_16k_nq32ds640,路径:data/funcodec_zh_en_16k_nq32ds640-*
- 划分:speech_tokenizer_16k,路径:data/speech_tokenizer_16k-*
提供机构:
CodecSR
原始信息汇总
数据集概述
数据集特征
- audio: 音频数据,采样率为16000 Hz。
- id: 字符串类型。
- gender: 字符串类型。
数据集分割
- original: 1817个样本,总大小132705761.0字节。
- academicodec_hifi_16k_320d: 1817个样本,总大小132229125.0字节。
- academicodec_hifi_16k_320d_large_uni: 1817个样本,总大小132229125.0字节。
- academicodec_hifi_24k_320d: 1817个样本,总大小198539525.0字节。
- audiodec_24k_320d: 1817个样本,总大小199542165.0字节。
- dac_16k: 1817个样本,总大小132767539.0字节。
- dac_24k: 1817个样本,总大小199002413.0字节。
- dac_44k: 1817个样本,总大小365415035.0字节。
- encodec_24k_12bps: 1817个样本,总大小199002413.0字节。
- encodec_24k_1_5bps: 1817个样本,总大小199002413.0字节。
- encodec_24k_24bps: 1817个样本,总大小199002413.0字节。
- encodec_24k_3bps: 1817个样本,总大小199002413.0字节。
- encodec_24k_6bps: 1817个样本,总大小199002413.0字节。
- funcodec_en_libritts_16k_gr1nq32ds320: 1817个样本,总大小132639413.0字节。
- funcodec_en_libritts_16k_gr8nq32ds320: 1817个样本,总大小132639413.0字节。
- funcodec_en_libritts_16k_nq32ds320: 1817个样本,总大小132767539.0字节。
- funcodec_en_libritts_16k_nq32ds640: 1817个样本,总大小132767539.0字节。
- funcodec_zh_en_16k_nq32ds320: 1817个样本,总大小132767539.0字节。
- funcodec_zh_en_16k_nq32ds640: 1817个样本,总大小132767539.0字节。
- speech_tokenizer_16k: 1817个样本,总大小133288325.0字节。
数据集大小
- 下载大小: 2558737096字节。
- 数据集总大小: 3417080060.0字节。
配置文件
- config_name: default
- data_files: 列出了所有分割的数据文件路径。



