five

Codec-SUPERB/beijing_opera_synth

收藏
Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/beijing_opera_synth
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: original path: data/original-* - split: academicodec_hifi_16k_320d path: data/academicodec_hifi_16k_320d-* - split: academicodec_hifi_16k_320d_large_uni path: data/academicodec_hifi_16k_320d_large_uni-* - split: academicodec_hifi_24k_320d path: data/academicodec_hifi_24k_320d-* - split: audiodec_24k_320d path: data/audiodec_24k_320d-* - split: dac_16k path: data/dac_16k-* - split: dac_24k path: data/dac_24k-* - split: dac_44k path: data/dac_44k-* - split: encodec_24k_12bps path: data/encodec_24k_12bps-* - split: encodec_24k_1_5bps path: data/encodec_24k_1_5bps-* - split: encodec_24k_24bps path: data/encodec_24k_24bps-* - split: encodec_24k_3bps path: data/encodec_24k_3bps-* - split: encodec_24k_6bps path: data/encodec_24k_6bps-* - split: funcodec_en_libritts_16k_gr1nq32ds320 path: data/funcodec_en_libritts_16k_gr1nq32ds320-* - split: funcodec_en_libritts_16k_gr8nq32ds320 path: data/funcodec_en_libritts_16k_gr8nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds320 path: data/funcodec_en_libritts_16k_nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds640 path: data/funcodec_en_libritts_16k_nq32ds640-* - split: funcodec_zh_en_16k_nq32ds320 path: data/funcodec_zh_en_16k_nq32ds320-* - split: funcodec_zh_en_16k_nq32ds640 path: data/funcodec_zh_en_16k_nq32ds640-* - split: speech_tokenizer_16k path: data/speech_tokenizer_16k-* dataset_info: features: - name: audio dtype: audio: sampling_rate: 48000 - name: id dtype: string splits: - name: original num_bytes: 108086982.0 num_examples: 236 - name: academicodec_hifi_16k_320d num_bytes: 35965586.0 num_examples: 236 - name: academicodec_hifi_16k_320d_large_uni num_bytes: 35965586.0 num_examples: 236 - name: academicodec_hifi_24k_320d num_bytes: 53939346.0 num_examples: 236 - name: audiodec_24k_320d num_bytes: 54109296.0 num_examples: 236 - name: dac_16k num_bytes: 36041106.0 num_examples: 236 - name: dac_24k num_bytes: 54052626.0 num_examples: 236 - name: dac_44k num_bytes: 99306570.0 num_examples: 236 - name: encodec_24k_12bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_1_5bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_24bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_3bps num_bytes: 54052626.0 num_examples: 236 - name: encodec_24k_6bps num_bytes: 54052626.0 num_examples: 236 - name: funcodec_en_libritts_16k_gr1nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_gr8nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_en_libritts_16k_nq32ds640 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_zh_en_16k_nq32ds320 num_bytes: 36041106.0 num_examples: 236 - name: funcodec_zh_en_16k_nq32ds640 num_bytes: 36041106.0 num_examples: 236 - name: speech_tokenizer_16k num_bytes: 36116626.0 num_examples: 236 download_size: 484042689 dataset_size: 1000093490.0 --- # Dataset Card for "beijing_opera_synth" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置项: - 配置名称:default 数据文件: - 拆分名称:original 路径:data/original-* - 拆分名称:academicodec_hifi_16k_320d 路径:data/academicodec_hifi_16k_320d-* - 拆分名称:academicodec_hifi_16k_320d_large_uni 路径:data/academicodec_hifi_16k_320d_large_uni-* - 拆分名称:academicodec_hifi_24k_320d 路径:data/academicodec_hifi_24k_320d-* - 拆分名称:audiodec_24k_320d 路径:data/audiodec_24k_320d-* - 拆分名称:dac_16k 路径:data/dac_16k-* - 拆分名称:dac_24k 路径:data/dac_24k-* - 拆分名称:dac_44k 路径:data/dac_44k-* - 拆分名称:encodec_24k_12bps 路径:data/encodec_24k_12bps-* - 拆分名称:encodec_24k_1_5bps 路径:data/encodec_24k_1_5bps-* - 拆分名称:encodec_24k_24bps 路径:data/encodec_24k_24bps-* - 拆分名称:encodec_24k_3bps 路径:data/encodec_24k_3bps-* - 拆分名称:encodec_24k_6bps 路径:data/encodec_24k_6bps-* - 拆分名称:funcodec_en_libritts_16k_gr1nq32ds320 路径:data/funcodec_en_libritts_16k_gr1nq32ds320-* - 拆分名称:funcodec_en_libritts_16k_gr8nq32ds320 路径:data/funcodec_en_libritts_16k_gr8nq32ds320-* - 拆分名称:funcodec_en_libritts_16k_nq32ds320 路径:data/funcodec_en_libritts_16k_nq32ds320-* - 拆分名称:funcodec_en_libritts_16k_nq32ds640 路径:data/funcodec_en_libritts_16k_nq32ds640-* - 拆分名称:funcodec_zh_en_16k_nq32ds320 路径:data/funcodec_zh_en_16k_nq32ds320-* - 拆分名称:funcodec_zh_en_16k_nq32ds640 路径:data/funcodec_zh_en_16k_nq32ds640-* - 拆分名称:speech_tokenizer_16k 路径:data/speech_tokenizer_16k-* 数据集信息: 特征: - 名称:音频(audio) 数据类型: 音频: 采样率:48000Hz - 名称:样本ID(id) 数据类型:字符串 数据集拆分: - 名称:original 字节数:108086982.0 样本数量:236 - 名称:academicodec_hifi_16k_320d 字节数:35965586.0 样本数量:236 - 名称:academicodec_hifi_16k_320d_large_uni 字节数:35965586.0 样本数量:236 - 名称:academicodec_hifi_24k_320d 字节数:53939346.0 样本数量:236 - 名称:audiodec_24k_320d 字节数:54109296.0 样本数量:236 - 名称:dac_16k 字节数:36041106.0 样本数量:236 - 名称:dac_24k 字节数:54052626.0 样本数量:236 - 名称:dac_44k 字节数:99306570.0 样本数量:236 - 名称:encodec_24k_12bps 字节数:54052626.0 样本数量:236 - 名称:encodec_24k_1_5bps 字节数:54052626.0 样本数量:236 - 名称:encodec_24k_24bps 字节数:54052626.0 样本数量:236 - 名称:encodec_24k_3bps 字节数:54052626.0 样本数量:236 - 名称:encodec_24k_6bps 字节数:54052626.0 样本数量:236 - 名称:funcodec_en_libritts_16k_gr1nq32ds320 字节数:36041106.0 样本数量:236 - 名称:funcodec_en_libritts_16k_gr8nq32ds320 字节数:36041106.0 样本数量:236 - 名称:funcodec_en_libritts_16k_nq32ds320 字节数:36041106.0 样本数量:236 - 名称:funcodec_en_libritts_16k_nq32ds640 字节数:36041106.0 样本数量:236 - 名称:funcodec_zh_en_16k_nq32ds320 字节数:36041106.0 样本数量:236 - 名称:funcodec_zh_en_16k_nq32ds640 字节数:36041106.0 样本数量:236 - 名称:speech_tokenizer_16k 字节数:36116626.0 样本数量:236 下载大小:484042689 数据集总大小:1000093490.0 --- # 「beijing_opera_synth」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总

数据集概述

数据集配置

  • 默认配置
    • 数据文件
      • original:路径为 data/original-*
      • academicodec_hifi_16k_320d:路径为 data/academicodec_hifi_16k_320d-*
      • academicodec_hifi_16k_320d_large_uni:路径为 data/academicodec_hifi_16k_320d_large_uni-*
      • academicodec_hifi_24k_320d:路径为 data/academicodec_hifi_24k_320d-*
      • audiodec_24k_320d:路径为 data/audiodec_24k_320d-*
      • dac_16k:路径为 data/dac_16k-*
      • dac_24k:路径为 data/dac_24k-*
      • dac_44k:路径为 data/dac_44k-*
      • encodec_24k_12bps:路径为 data/encodec_24k_12bps-*
      • encodec_24k_1_5bps:路径为 data/encodec_24k_1_5bps-*
      • encodec_24k_24bps:路径为 data/encodec_24k_24bps-*
      • encodec_24k_3bps:路径为 data/encodec_24k_3bps-*
      • encodec_24k_6bps:路径为 data/encodec_24k_6bps-*
      • funcodec_en_libritts_16k_gr1nq32ds320:路径为 data/funcodec_en_libritts_16k_gr1nq32ds320-*
      • funcodec_en_libritts_16k_gr8nq32ds320:路径为 data/funcodec_en_libritts_16k_gr8nq32ds320-*
      • funcodec_en_libritts_16k_nq32ds320:路径为 data/funcodec_en_libritts_16k_nq32ds320-*
      • funcodec_en_libritts_16k_nq32ds640:路径为 data/funcodec_en_libritts_16k_nq32ds640-*
      • funcodec_zh_en_16k_nq32ds320:路径为 data/funcodec_zh_en_16k_nq32ds320-*
      • funcodec_zh_en_16k_nq32ds640:路径为 data/funcodec_zh_en_16k_nq32ds640-*
      • speech_tokenizer_16k:路径为 data/speech_tokenizer_16k-*

数据集信息

  • 特征

    • audio:采样率为 48000
    • id:字符串类型
  • 分割

    • original:字节数为 108086982.0,示例数为 236
    • academicodec_hifi_16k_320d:字节数为 35965586.0,示例数为 236
    • academicodec_hifi_16k_320d_large_uni:字节数为 35965586.0,示例数为 236
    • academicodec_hifi_24k_320d:字节数为 53939346.0,示例数为 236
    • audiodec_24k_320d:字节数为 54109296.0,示例数为 236
    • dac_16k:字节数为 36041106.0,示例数为 236
    • dac_24k:字节数为 54052626.0,示例数为 236
    • dac_44k:字节数为 99306570.0,示例数为 236
    • encodec_24k_12bps:字节数为 54052626.0,示例数为 236
    • encodec_24k_1_5bps:字节数为 54052626.0,示例数为 236
    • encodec_24k_24bps:字节数为 54052626.0,示例数为 236
    • encodec_24k_3bps:字节数为 54052626.0,示例数为 236
    • encodec_24k_6bps:字节数为 54052626.0,示例数为 236
    • funcodec_en_libritts_16k_gr1nq32ds320:字节数为 36041106.0,示例数为 236
    • funcodec_en_libritts_16k_gr8nq32ds320:字节数为 36041106.0,示例数为 236
    • funcodec_en_libritts_16k_nq32ds320:字节数为 36041106.0,示例数为 236
    • funcodec_en_libritts_16k_nq32ds640:字节数为 36041106.0,示例数为 236
    • funcodec_zh_en_16k_nq32ds320:字节数为 36041106.0,示例数为 236
    • funcodec_zh_en_16k_nq32ds640:字节数为 36041106.0,示例数为 236
    • speech_tokenizer_16k:字节数为 36116626.0,示例数为 236
  • 数据集大小

    • 下载大小:484042689 字节
    • 数据集大小:1000093490.0 字节
搜集汇总
数据集介绍
main_image_url
构建方式
Codec-SUPERB/beijing_opera_synth数据集的构建,采取了多种音频编码技术的处理,包含了原始音频及其经过不同编码器处理后的变体。该数据集的音频采样率为48000赫兹,涵盖了从原始音频到各种压缩格式的转换,旨在为声音合成和编码算法提供实验基础。
特点
该数据集的特点在于其多样性,不仅包含了未经处理的原始音频,还包含了通过不同编码器处理后的音频版本,如academicodec、audiodec、encodec和funcodec等。这些音频版本在压缩率和音质上各有千秋,为研究不同编码技术对音频质量的影响提供了丰富的素材。
使用方法
使用该数据集时,研究者可根据具体需求选择不同split的音频文件,例如original、academicodec_hifi_16k_320d等。每个split均包含了236个音频样本,且每个样本均有唯一的id标识。数据集的下载和加载可通过HuggingFace的datasets库实现,方便快捷。
背景与挑战
背景概述
Codec-SUPERB/beijing_opera_synth数据集,是在音频信号处理领域的一项重要研究成果,旨在推动北京歌剧合成语音的研究与应用。该数据集由多个研究机构和学者共同开发,于近年来问世。其核心研究问题是提高北京歌剧语音合成的质量,为相关领域的研究提供了宝贵的资源,对于推动中文语音合成技术的发展具有显著影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括:多样化的语音编码格式对数据的一致性和可比性提出了挑战;高采样率音频数据的存储和处理需要更高的计算资源;此外,数据集在涵盖不同北京歌剧唱段的同时,还需保证语音样本的质量和多样性。在研究领域问题方面,数据集需解决如何准确捕捉北京歌剧语音特有的韵律和情感,以及如何在高压缩率下保持语音的自然度和理解度等难题。
常用场景
经典使用场景
在音频处理与合成领域,Codec-SUPERB/beijing_opera_synth数据集被广泛应用于北京 opera 音频的合成与风格模仿。该数据集提供了多种采样率与编码方式的音频文件,为研究人员提供了一个丰富的资源库,以探索音频编码与合成技术。
解决学术问题
该数据集解决了音频合成中的音质保持与风格再现问题,为学术研究提供了高质量的音频样本,有助于提升音频编码器的性能评估,促进音频合成技术的发展。
衍生相关工作
基于此数据集,研究者们已经衍生出一系列相关工作,包括音频编码算法的优化、音乐风格转换技术的探索以及跨语种音频合成的实现,进一步拓宽了音频处理领域的研究范围。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作