CodecSR/speech_accent_archive_english
收藏Hugging Face2024-05-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/CodecSR/speech_accent_archive_english
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 44100
- name: id
dtype: string
- name: accent
dtype: string
splits:
- name: original
num_bytes: 1159460679.0
num_examples: 579
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 1172066479.0
num_examples: 579
- name: academicodec_hifi_24k_320d
num_bytes: 1172066479.0
num_examples: 579
- name: audiodec_24k_300d
num_bytes: 1172427759.0
num_examples: 579
- name: audiodec_48k_300d_uni
num_bytes: 1172427759.0
num_examples: 579
- name: dac_16k
num_bytes: 1172249263.0
num_examples: 579
- name: dac_24k
num_bytes: 1172249263.0
num_examples: 579
- name: dac_44k
num_bytes: 1172249263.0
num_examples: 579
- name: encodec_24k_12bps
num_bytes: 1172249263.0
num_examples: 579
- name: encodec_24k_1_5bps
num_bytes: 1172249263.0
num_examples: 579
- name: encodec_24k_24bps
num_bytes: 1172249263.0
num_examples: 579
- name: encodec_24k_3bps
num_bytes: 1172249263.0
num_examples: 579
- name: encodec_24k_6bps
num_bytes: 1172249263.0
num_examples: 579
- name: facodec_16k
num_bytes: 1172185759.0
num_examples: 579
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 1172249263.0
num_examples: 579
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 1172249263.0
num_examples: 579
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 1172249263.0
num_examples: 579
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 1172249263.0
num_examples: 579
- name: language_codec_chinese_24k_nq8_12kbps
num_bytes: 1172422319.0
num_examples: 579
- name: language_codec_paper_24k_nq8_12kbps
num_bytes: 1172422319.0
num_examples: 579
- name: speech_tokenizer_16k
num_bytes: 1172422319.0
num_examples: 579
download_size: 24215582642
dataset_size: 24604893027.0
configs:
- config_name: default
data_files:
- split: original
path: data/original-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_300d
path: data/audiodec_24k_300d-*
- split: audiodec_48k_300d_uni
path: data/audiodec_48k_300d_uni-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: facodec_16k
path: data/facodec_16k-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: language_codec_chinese_24k_nq8_12kbps
path: data/language_codec_chinese_24k_nq8_12kbps-*
- split: language_codec_paper_24k_nq8_12kbps
path: data/language_codec_paper_24k_nq8_12kbps-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
---
提供机构:
CodecSR
原始信息汇总
数据集概述
数据集特征
- audio: 音频特征,采样率为44100。
- id: 字符串类型。
- accent: 字符串类型。
数据集分割
- original: 579个样本,大小为1159460679.0字节。
- academicodec_hifi_16k_320d_large_uni: 579个样本,大小为1172066479.0字节。
- academicodec_hifi_24k_320d: 579个样本,大小为1172066479.0字节。
- audiodec_24k_300d: 579个样本,大小为1172427759.0字节。
- audiodec_48k_300d_uni: 579个样本,大小为1172427759.0字节。
- dac_16k: 579个样本,大小为1172249263.0字节。
- dac_24k: 579个样本,大小为1172249263.0字节。
- dac_44k: 579个样本,大小为1172249263.0字节。
- encodec_24k_12bps: 579个样本,大小为1172249263.0字节。
- encodec_24k_1_5bps: 579个样本,大小为1172249263.0字节。
- encodec_24k_24bps: 579个样本,大小为1172249263.0字节。
- encodec_24k_3bps: 579个样本,大小为1172249263.0字节。
- encodec_24k_6bps: 579个样本,大小为1172249263.0字节。
- facodec_16k: 579个样本,大小为1172185759.0字节。
- funcodec_en_libritts_16k_nq32ds320: 579个样本,大小为1172249263.0字节。
- funcodec_en_libritts_16k_nq32ds640: 579个样本,大小为1172249263.0字节。
- funcodec_zh_en_16k_nq32ds320: 579个样本,大小为1172249263.0字节。
- funcodec_zh_en_16k_nq32ds640: 579个样本,大小为1172249263.0字节。
- language_codec_chinese_24k_nq8_12kbps: 579个样本,大小为1172422319.0字节。
- language_codec_paper_24k_nq8_12kbps: 579个样本,大小为1172422319.0字节。
- speech_tokenizer_16k: 579个样本,大小为1172422319.0字节。
数据集大小
- 下载大小: 24215582642字节。
- 数据集总大小: 24604893027.0字节。
配置文件
- config_name: default
- data_files: 包含多个分割的数据文件路径,每个分割对应不同的数据集部分。
搜集汇总
背景与挑战
背景概述
该数据集是一个英语口音语音档案库,包含579个音频样本,每个样本带有口音标签和唯一标识,采样率为44100 Hz。数据集提供了多个不同语音编码器处理后的版本,支持多种采样率和比特率配置,适用于语音编码、口音分析和语音处理研究。
以上内容由遇见数据集搜集并总结生成



