Codec-SUPERB/beijing_opera_synth

Name: Codec-SUPERB/beijing_opera_synth
Creator: Codec-SUPERB
Published: 2024-01-28 03:04:56
License: 暂无描述

Hugging Face2024-01-28 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Codec-SUPERB/beijing_opera_synth

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: original path: data/original-* - split: academicodec_hifi_16k_320d path: data/academicodec_hifi_16k_320d-* - split: academicodec_hifi_16k_320d_large_uni path: data/academicodec_hifi_16k_320d_large_uni-* - split: academicodec_hifi_24k_320d path: data/academicodec_hifi_24k_320d-* - split: audiodec_24k_320d path: data/audiodec_24k_320d-* - split: dac_16k path: data/dac_16k-* - split: dac_24k path: data/dac_24k-* - split: dac_44k path: data/dac_44k-* - split: encodec_24k_12bps path: data/encodec_24k_12bps-* - split: encodec_24k_1_5bps path: data/encodec_24k_1_5bps-* - split: encodec_24k_24bps path: data/encodec_24k_24bps-* - split: encodec_24k_3bps path: data/encodec_24k_3bps-* - split: encodec_24k_6bps path: data/encodec_24k_6bps-* - split: funcodec_en_libritts_16k_gr1nq32ds320 path: data/funcodec_en_libritts_16k_gr1nq32ds320-* - split: funcodec_en_libritts_16k_gr8nq32ds320 path: data/funcodec_en_libritts_16k_gr8nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds320 path: data/funcodec_en_libritts_16k_nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds640 path: data/funcodec_en_libritts_16k_nq32ds640-* - split: funcodec_zh_en_16k_nq32ds320 path: data/funcodec_zh_en_16k_nq32ds320-* - split: funcodec_zh_en_16k_nq32ds640 path: data/funcodec_zh_en_16k_nq32ds640-* - split: speech_tokenizer_16k path: data/speech_tokenizer_16k-* dataset_info: features: - name: audio dtype: audio: sampling_rate: 48000 - name: id dtype: string splits: - name: original num_bytes: 108086982.0 num_examples: 236 - name: academicodec_hifi_16k_320d num_bytes: 35965586.0 num_examples: 236 - name: academicodec_hifi_16k_320d_large_uni num_bytes: 35965586.0 num_examples: 236 - name: academicodec_hifi_24k_320d num_bytes: 53939346.0 num_examples: 236 - name: audiodec_24k_320d num_bytes: 54109296.0 num_examples: 236 - name: dac_16k num_bytes: 36041106.0 num_examples: 236 - name: dac_24k num_bytes: 54052626.0 num_examples: 236 - name: dac_44k num_bytes: 99306570.0 num_examples: 236 - name: encodec_24k_12bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_1_5bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_24bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_3bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_6bps num_bytes: 54052626.0 num_examples: 236 - name: funcodec_en_libritts_16k_gr1nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_gr8nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_nq32ds640 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_zh_en_16k_nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_zh_en_16k_nq32ds640 num_bytes: 36041106.0 num_examples: 236 - name: speech_tokenizer_16k num_bytes: 36116626.0 num_examples: 236 download_size: 484042689 dataset_size: 1000093490.0 --- # Dataset Card for "beijing_opera_synth" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置项： - 配置名称：default 数据文件： - 拆分名称：original 路径：data/original-* - 拆分名称：academicodec_hifi_16k_320d 路径：data/academicodec_hifi_16k_320d-* - 拆分名称：academicodec_hifi_16k_320d_large_uni 路径：data/academicodec_hifi_16k_320d_large_uni-* - 拆分名称：academicodec_hifi_24k_320d 路径：data/academicodec_hifi_24k_320d-* - 拆分名称：audiodec_24k_320d 路径：data/audiodec_24k_320d-* - 拆分名称：dac_16k 路径：data/dac_16k-* - 拆分名称：dac_24k 路径：data/dac_24k-* - 拆分名称：dac_44k 路径：data/dac_44k-* - 拆分名称：encodec_24k_12bps 路径：data/encodec_24k_12bps-* - 拆分名称：encodec_24k_1_5bps 路径：data/encodec_24k_1_5bps-* - 拆分名称：encodec_24k_24bps 路径：data/encodec_24k_24bps-* - 拆分名称：encodec_24k_3bps 路径：data/encodec_24k_3bps-* - 拆分名称：encodec_24k_6bps 路径：data/encodec_24k_6bps-* - 拆分名称：funcodec_en_libritts_16k_gr1nq32ds320 路径：data/funcodec_en_libritts_16k_gr1nq32ds320-* - 拆分名称：funcodec_en_libritts_16k_gr8nq32ds320 路径：data/funcodec_en_libritts_16k_gr8nq32ds320-* - 拆分名称：funcodec_en_libritts_16k_nq32ds320 路径：data/funcodec_en_libritts_16k_nq32ds320-* - 拆分名称：funcodec_en_libritts_16k_nq32ds640 路径：data/funcodec_en_libritts_16k_nq32ds640-* - 拆分名称：funcodec_zh_en_16k_nq32ds320 路径：data/funcodec_zh_en_16k_nq32ds320-* - 拆分名称：funcodec_zh_en_16k_nq32ds640 路径：data/funcodec_zh_en_16k_nq32ds640-* - 拆分名称：speech_tokenizer_16k 路径：data/speech_tokenizer_16k-* 数据集信息：特征： - 名称：音频（audio）数据类型：音频：采样率：48000Hz - 名称：样本ID（id）数据类型：字符串数据集拆分： - 名称：original 字节数：108086982.0 样本数量：236 - 名称：academicodec_hifi_16k_320d 字节数：35965586.0 样本数量：236 - 名称：academicodec_hifi_16k_320d_large_uni 字节数：35965586.0 样本数量：236 - 名称：academicodec_hifi_24k_320d 字节数：53939346.0 样本数量：236 - 名称：audiodec_24k_320d 字节数：54109296.0 样本数量：236 - 名称：dac_16k 字节数：36041106.0 样本数量：236 - 名称：dac_24k 字节数：54052626.0 样本数量：236 - 名称：dac_44k 字节数：99306570.0 样本数量：236 - 名称：encodec_24k_12bps 字节数：54052626.0 样本数量：236 - 名称：encodec_24k_1_5bps 字节数：54052626.0 样本数量：236 - 名称：encodec_24k_24bps 字节数：54052626.0 样本数量：236 - 名称：encodec_24k_3bps 字节数：54052626.0 样本数量：236 - 名称：encodec_24k_6bps 字节数：54052626.0 样本数量：236 - 名称：funcodec_en_libritts_16k_gr1nq32ds320 字节数：36041106.0 样本数量：236 - 名称：funcodec_en_libritts_16k_gr8nq32ds320 字节数：36041106.0 样本数量：236 - 名称：funcodec_en_libritts_16k_nq32ds320 字节数：36041106.0 样本数量：236 - 名称：funcodec_en_libritts_16k_nq32ds640 字节数：36041106.0 样本数量：236 - 名称：funcodec_zh_en_16k_nq32ds320 字节数：36041106.0 样本数量：236 - 名称：funcodec_zh_en_16k_nq32ds640 字节数：36041106.0 样本数量：236 - 名称：speech_tokenizer_16k 字节数：36116626.0 样本数量：236 下载大小：484042689 数据集总大小：1000093490.0 --- # 「beijing_opera_synth」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Codec-SUPERB

原始信息汇总

数据集概述

数据集配置

默认配置：
- 数据文件：
  - original：路径为 data/original-*
  - academicodec_hifi_16k_320d：路径为 data/academicodec_hifi_16k_320d-*
  - academicodec_hifi_16k_320d_large_uni：路径为 data/academicodec_hifi_16k_320d_large_uni-*
  - academicodec_hifi_24k_320d：路径为 data/academicodec_hifi_24k_320d-*
  - audiodec_24k_320d：路径为 data/audiodec_24k_320d-*
  - dac_16k：路径为 data/dac_16k-*
  - dac_24k：路径为 data/dac_24k-*
  - dac_44k：路径为 data/dac_44k-*
  - encodec_24k_12bps：路径为 data/encodec_24k_12bps-*
  - encodec_24k_1_5bps：路径为 data/encodec_24k_1_5bps-*
  - encodec_24k_24bps：路径为 data/encodec_24k_24bps-*
  - encodec_24k_3bps：路径为 data/encodec_24k_3bps-*
  - encodec_24k_6bps：路径为 data/encodec_24k_6bps-*
  - funcodec_en_libritts_16k_gr1nq32ds320：路径为 data/funcodec_en_libritts_16k_gr1nq32ds320-*
  - funcodec_en_libritts_16k_gr8nq32ds320：路径为 data/funcodec_en_libritts_16k_gr8nq32ds320-*
  - funcodec_en_libritts_16k_nq32ds320：路径为 data/funcodec_en_libritts_16k_nq32ds320-*
  - funcodec_en_libritts_16k_nq32ds640：路径为 data/funcodec_en_libritts_16k_nq32ds640-*
  - funcodec_zh_en_16k_nq32ds320：路径为 data/funcodec_zh_en_16k_nq32ds320-*
  - funcodec_zh_en_16k_nq32ds640：路径为 data/funcodec_zh_en_16k_nq32ds640-*
  - speech_tokenizer_16k：路径为 data/speech_tokenizer_16k-*

数据集信息

特征：
- audio：采样率为 48000
- id：字符串类型
分割：
- original：字节数为 108086982.0，示例数为 236
- academicodec_hifi_16k_320d：字节数为 35965586.0，示例数为 236
- academicodec_hifi_16k_320d_large_uni：字节数为 35965586.0，示例数为 236
- academicodec_hifi_24k_320d：字节数为 53939346.0，示例数为 236
- audiodec_24k_320d：字节数为 54109296.0，示例数为 236
- dac_16k：字节数为 36041106.0，示例数为 236
- dac_24k：字节数为 54052626.0，示例数为 236
- dac_44k：字节数为 99306570.0，示例数为 236
- encodec_24k_12bps：字节数为 54052626.0，示例数为 236
- encodec_24k_1_5bps：字节数为 54052626.0，示例数为 236
- encodec_24k_24bps：字节数为 54052626.0，示例数为 236
- encodec_24k_3bps：字节数为 54052626.0，示例数为 236
- encodec_24k_6bps：字节数为 54052626.0，示例数为 236
- funcodec_en_libritts_16k_gr1nq32ds320：字节数为 36041106.0，示例数为 236
- funcodec_en_libritts_16k_gr8nq32ds320：字节数为 36041106.0，示例数为 236
- funcodec_en_libritts_16k_nq32ds320：字节数为 36041106.0，示例数为 236
- funcodec_en_libritts_16k_nq32ds640：字节数为 36041106.0，示例数为 236
- funcodec_zh_en_16k_nq32ds320：字节数为 36041106.0，示例数为 236
- funcodec_zh_en_16k_nq32ds640：字节数为 36041106.0，示例数为 236
- speech_tokenizer_16k：字节数为 36116626.0，示例数为 236
数据集大小：
- 下载大小：484042689 字节
- 数据集大小：1000093490.0 字节

搜集汇总

数据集介绍

构建方式

Codec-SUPERB/beijing_opera_synth数据集的构建，采取了多种音频编码技术的处理，包含了原始音频及其经过不同编码器处理后的变体。该数据集的音频采样率为48000赫兹，涵盖了从原始音频到各种压缩格式的转换，旨在为声音合成和编码算法提供实验基础。

特点

该数据集的特点在于其多样性，不仅包含了未经处理的原始音频，还包含了通过不同编码器处理后的音频版本，如academicodec、audiodec、encodec和funcodec等。这些音频版本在压缩率和音质上各有千秋，为研究不同编码技术对音频质量的影响提供了丰富的素材。

使用方法

使用该数据集时，研究者可根据具体需求选择不同split的音频文件，例如original、academicodec_hifi_16k_320d等。每个split均包含了236个音频样本，且每个样本均有唯一的id标识。数据集的下载和加载可通过HuggingFace的datasets库实现，方便快捷。

背景与挑战

背景概述

Codec-SUPERB/beijing_opera_synth数据集，是在音频信号处理领域的一项重要研究成果，旨在推动北京歌剧合成语音的研究与应用。该数据集由多个研究机构和学者共同开发，于近年来问世。其核心研究问题是提高北京歌剧语音合成的质量，为相关领域的研究提供了宝贵的资源，对于推动中文语音合成技术的发展具有显著影响。

当前挑战

该数据集在构建过程中面临的挑战主要包括：多样化的语音编码格式对数据的一致性和可比性提出了挑战；高采样率音频数据的存储和处理需要更高的计算资源；此外，数据集在涵盖不同北京歌剧唱段的同时，还需保证语音样本的质量和多样性。在研究领域问题方面，数据集需解决如何准确捕捉北京歌剧语音特有的韵律和情感，以及如何在高压缩率下保持语音的自然度和理解度等难题。

常用场景

经典使用场景

在音频处理与合成领域，Codec-SUPERB/beijing_opera_synth数据集被广泛应用于北京 opera 音频的合成与风格模仿。该数据集提供了多种采样率与编码方式的音频文件，为研究人员提供了一个丰富的资源库，以探索音频编码与合成技术。

解决学术问题

该数据集解决了音频合成中的音质保持与风格再现问题，为学术研究提供了高质量的音频样本，有助于提升音频编码器的性能评估，促进音频合成技术的发展。

衍生相关工作

基于此数据集，研究者们已经衍生出一系列相关工作，包括音频编码算法的优化、音乐风格转换技术的探索以及跨语种音频合成的实现，进一步拓宽了音频处理领域的研究范围。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集