Codec-SUPERB/beijing_opera_synth
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/beijing_opera_synth
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: original
path: data/original-*
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 48000
- name: id
dtype: string
splits:
- name: original
num_bytes: 108086982.0
num_examples: 236
- name: academicodec_hifi_16k_320d
num_bytes: 35965586.0
num_examples: 236
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 35965586.0
num_examples: 236
- name: academicodec_hifi_24k_320d
num_bytes: 53939346.0
num_examples: 236
- name: audiodec_24k_320d
num_bytes: 54109296.0
num_examples: 236
- name: dac_16k
num_bytes: 36041106.0
num_examples: 236
- name: dac_24k
num_bytes: 54052626.0
num_examples: 236
- name: dac_44k
num_bytes: 99306570.0
num_examples: 236
- name: encodec_24k_12bps
num_bytes: 54052626.0
num_examples: 236
- name: encodec_24k_1_5bps
num_bytes: 54052626.0
num_examples: 236
- name: encodec_24k_24bps
num_bytes: 54052626.0
num_examples: 236
- name: encodec_24k_3bps
num_bytes: 54052626.0
num_examples: 236
- name: encodec_24k_6bps
num_bytes: 54052626.0
num_examples: 236
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 36041106.0
num_examples: 236
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 36041106.0
num_examples: 236
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 36041106.0
num_examples: 236
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 36041106.0
num_examples: 236
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 36041106.0
num_examples: 236
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 36041106.0
num_examples: 236
- name: speech_tokenizer_16k
num_bytes: 36116626.0
num_examples: 236
download_size: 484042689
dataset_size: 1000093490.0
---
# Dataset Card for "beijing_opera_synth"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 拆分名称:original
路径:data/original-*
- 拆分名称:academicodec_hifi_16k_320d
路径:data/academicodec_hifi_16k_320d-*
- 拆分名称:academicodec_hifi_16k_320d_large_uni
路径:data/academicodec_hifi_16k_320d_large_uni-*
- 拆分名称:academicodec_hifi_24k_320d
路径:data/academicodec_hifi_24k_320d-*
- 拆分名称:audiodec_24k_320d
路径:data/audiodec_24k_320d-*
- 拆分名称:dac_16k
路径:data/dac_16k-*
- 拆分名称:dac_24k
路径:data/dac_24k-*
- 拆分名称:dac_44k
路径:data/dac_44k-*
- 拆分名称:encodec_24k_12bps
路径:data/encodec_24k_12bps-*
- 拆分名称:encodec_24k_1_5bps
路径:data/encodec_24k_1_5bps-*
- 拆分名称:encodec_24k_24bps
路径:data/encodec_24k_24bps-*
- 拆分名称:encodec_24k_3bps
路径:data/encodec_24k_3bps-*
- 拆分名称:encodec_24k_6bps
路径:data/encodec_24k_6bps-*
- 拆分名称:funcodec_en_libritts_16k_gr1nq32ds320
路径:data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 拆分名称:funcodec_en_libritts_16k_gr8nq32ds320
路径:data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 拆分名称:funcodec_en_libritts_16k_nq32ds320
路径:data/funcodec_en_libritts_16k_nq32ds320-*
- 拆分名称:funcodec_en_libritts_16k_nq32ds640
路径:data/funcodec_en_libritts_16k_nq32ds640-*
- 拆分名称:funcodec_zh_en_16k_nq32ds320
路径:data/funcodec_zh_en_16k_nq32ds320-*
- 拆分名称:funcodec_zh_en_16k_nq32ds640
路径:data/funcodec_zh_en_16k_nq32ds640-*
- 拆分名称:speech_tokenizer_16k
路径:data/speech_tokenizer_16k-*
数据集信息:
特征:
- 名称:音频(audio)
数据类型:
音频:
采样率:48000Hz
- 名称:样本ID(id)
数据类型:字符串
数据集拆分:
- 名称:original
字节数:108086982.0
样本数量:236
- 名称:academicodec_hifi_16k_320d
字节数:35965586.0
样本数量:236
- 名称:academicodec_hifi_16k_320d_large_uni
字节数:35965586.0
样本数量:236
- 名称:academicodec_hifi_24k_320d
字节数:53939346.0
样本数量:236
- 名称:audiodec_24k_320d
字节数:54109296.0
样本数量:236
- 名称:dac_16k
字节数:36041106.0
样本数量:236
- 名称:dac_24k
字节数:54052626.0
样本数量:236
- 名称:dac_44k
字节数:99306570.0
样本数量:236
- 名称:encodec_24k_12bps
字节数:54052626.0
样本数量:236
- 名称:encodec_24k_1_5bps
字节数:54052626.0
样本数量:236
- 名称:encodec_24k_24bps
字节数:54052626.0
样本数量:236
- 名称:encodec_24k_3bps
字节数:54052626.0
样本数量:236
- 名称:encodec_24k_6bps
字节数:54052626.0
样本数量:236
- 名称:funcodec_en_libritts_16k_gr1nq32ds320
字节数:36041106.0
样本数量:236
- 名称:funcodec_en_libritts_16k_gr8nq32ds320
字节数:36041106.0
样本数量:236
- 名称:funcodec_en_libritts_16k_nq32ds320
字节数:36041106.0
样本数量:236
- 名称:funcodec_en_libritts_16k_nq32ds640
字节数:36041106.0
样本数量:236
- 名称:funcodec_zh_en_16k_nq32ds320
字节数:36041106.0
样本数量:236
- 名称:funcodec_zh_en_16k_nq32ds640
字节数:36041106.0
样本数量:236
- 名称:speech_tokenizer_16k
字节数:36116626.0
样本数量:236
下载大小:484042689
数据集总大小:1000093490.0
---
# 「beijing_opera_synth」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 数据文件:
original:路径为data/original-*academicodec_hifi_16k_320d:路径为data/academicodec_hifi_16k_320d-*academicodec_hifi_16k_320d_large_uni:路径为data/academicodec_hifi_16k_320d_large_uni-*academicodec_hifi_24k_320d:路径为data/academicodec_hifi_24k_320d-*audiodec_24k_320d:路径为data/audiodec_24k_320d-*dac_16k:路径为data/dac_16k-*dac_24k:路径为data/dac_24k-*dac_44k:路径为data/dac_44k-*encodec_24k_12bps:路径为data/encodec_24k_12bps-*encodec_24k_1_5bps:路径为data/encodec_24k_1_5bps-*encodec_24k_24bps:路径为data/encodec_24k_24bps-*encodec_24k_3bps:路径为data/encodec_24k_3bps-*encodec_24k_6bps:路径为data/encodec_24k_6bps-*funcodec_en_libritts_16k_gr1nq32ds320:路径为data/funcodec_en_libritts_16k_gr1nq32ds320-*funcodec_en_libritts_16k_gr8nq32ds320:路径为data/funcodec_en_libritts_16k_gr8nq32ds320-*funcodec_en_libritts_16k_nq32ds320:路径为data/funcodec_en_libritts_16k_nq32ds320-*funcodec_en_libritts_16k_nq32ds640:路径为data/funcodec_en_libritts_16k_nq32ds640-*funcodec_zh_en_16k_nq32ds320:路径为data/funcodec_zh_en_16k_nq32ds320-*funcodec_zh_en_16k_nq32ds640:路径为data/funcodec_zh_en_16k_nq32ds640-*speech_tokenizer_16k:路径为data/speech_tokenizer_16k-*
- 数据文件:
数据集信息
-
特征:
audio:采样率为 48000id:字符串类型
-
分割:
original:字节数为 108086982.0,示例数为 236academicodec_hifi_16k_320d:字节数为 35965586.0,示例数为 236academicodec_hifi_16k_320d_large_uni:字节数为 35965586.0,示例数为 236academicodec_hifi_24k_320d:字节数为 53939346.0,示例数为 236audiodec_24k_320d:字节数为 54109296.0,示例数为 236dac_16k:字节数为 36041106.0,示例数为 236dac_24k:字节数为 54052626.0,示例数为 236dac_44k:字节数为 99306570.0,示例数为 236encodec_24k_12bps:字节数为 54052626.0,示例数为 236encodec_24k_1_5bps:字节数为 54052626.0,示例数为 236encodec_24k_24bps:字节数为 54052626.0,示例数为 236encodec_24k_3bps:字节数为 54052626.0,示例数为 236encodec_24k_6bps:字节数为 54052626.0,示例数为 236funcodec_en_libritts_16k_gr1nq32ds320:字节数为 36041106.0,示例数为 236funcodec_en_libritts_16k_gr8nq32ds320:字节数为 36041106.0,示例数为 236funcodec_en_libritts_16k_nq32ds320:字节数为 36041106.0,示例数为 236funcodec_en_libritts_16k_nq32ds640:字节数为 36041106.0,示例数为 236funcodec_zh_en_16k_nq32ds320:字节数为 36041106.0,示例数为 236funcodec_zh_en_16k_nq32ds640:字节数为 36041106.0,示例数为 236speech_tokenizer_16k:字节数为 36116626.0,示例数为 236
-
数据集大小:
- 下载大小:484042689 字节
- 数据集大小:1000093490.0 字节
搜集汇总
数据集介绍

构建方式
Codec-SUPERB/beijing_opera_synth数据集的构建,采取了多种音频编码技术的处理,包含了原始音频及其经过不同编码器处理后的变体。该数据集的音频采样率为48000赫兹,涵盖了从原始音频到各种压缩格式的转换,旨在为声音合成和编码算法提供实验基础。
特点
该数据集的特点在于其多样性,不仅包含了未经处理的原始音频,还包含了通过不同编码器处理后的音频版本,如academicodec、audiodec、encodec和funcodec等。这些音频版本在压缩率和音质上各有千秋,为研究不同编码技术对音频质量的影响提供了丰富的素材。
使用方法
使用该数据集时,研究者可根据具体需求选择不同split的音频文件,例如original、academicodec_hifi_16k_320d等。每个split均包含了236个音频样本,且每个样本均有唯一的id标识。数据集的下载和加载可通过HuggingFace的datasets库实现,方便快捷。
背景与挑战
背景概述
Codec-SUPERB/beijing_opera_synth数据集,是在音频信号处理领域的一项重要研究成果,旨在推动北京歌剧合成语音的研究与应用。该数据集由多个研究机构和学者共同开发,于近年来问世。其核心研究问题是提高北京歌剧语音合成的质量,为相关领域的研究提供了宝贵的资源,对于推动中文语音合成技术的发展具有显著影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括:多样化的语音编码格式对数据的一致性和可比性提出了挑战;高采样率音频数据的存储和处理需要更高的计算资源;此外,数据集在涵盖不同北京歌剧唱段的同时,还需保证语音样本的质量和多样性。在研究领域问题方面,数据集需解决如何准确捕捉北京歌剧语音特有的韵律和情感,以及如何在高压缩率下保持语音的自然度和理解度等难题。
常用场景
经典使用场景
在音频处理与合成领域,Codec-SUPERB/beijing_opera_synth数据集被广泛应用于北京 opera 音频的合成与风格模仿。该数据集提供了多种采样率与编码方式的音频文件,为研究人员提供了一个丰富的资源库,以探索音频编码与合成技术。
解决学术问题
该数据集解决了音频合成中的音质保持与风格再现问题,为学术研究提供了高质量的音频样本,有助于提升音频编码器的性能评估,促进音频合成技术的发展。
衍生相关工作
基于此数据集,研究者们已经衍生出一系列相关工作,包括音频编码算法的优化、音乐风格转换技术的探索以及跨语种音频合成的实现,进一步拓宽了音频处理领域的研究范围。
以上内容由遇见数据集搜集并总结生成



