Codec-SUPERB/m4singer_synth

Name: Codec-SUPERB/m4singer_synth
Creator: Codec-SUPERB
Published: 2024-02-02 08:11:27
License: 暂无描述

Hugging Face2024-02-02 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Codec-SUPERB/m4singer_synth

下载链接

链接失效反馈

官方服务：

资源简介：

--- configs: - config_name: default data_files: - split: original path: data/original-* - split: academicodec_hifi_16k_320d path: data/academicodec_hifi_16k_320d-* - split: academicodec_hifi_16k_320d_large_uni path: data/academicodec_hifi_16k_320d_large_uni-* - split: academicodec_hifi_24k_320d path: data/academicodec_hifi_24k_320d-* - split: audiodec_24k_320d path: data/audiodec_24k_320d-* - split: dac_16k path: data/dac_16k-* - split: dac_24k path: data/dac_24k-* - split: dac_44k path: data/dac_44k-* - split: encodec_24k_12bps path: data/encodec_24k_12bps-* - split: encodec_24k_1_5bps path: data/encodec_24k_1_5bps-* - split: encodec_24k_24bps path: data/encodec_24k_24bps-* - split: encodec_24k_3bps path: data/encodec_24k_3bps-* - split: encodec_24k_6bps path: data/encodec_24k_6bps-* - split: funcodec_en_libritts_16k_gr1nq32ds320 path: data/funcodec_en_libritts_16k_gr1nq32ds320-* - split: funcodec_en_libritts_16k_gr8nq32ds320 path: data/funcodec_en_libritts_16k_gr8nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds320 path: data/funcodec_en_libritts_16k_nq32ds320-* - split: funcodec_en_libritts_16k_nq32ds640 path: data/funcodec_en_libritts_16k_nq32ds640-* - split: funcodec_zh_en_16k_nq32ds320 path: data/funcodec_zh_en_16k_nq32ds320-* - split: funcodec_zh_en_16k_nq32ds640 path: data/funcodec_zh_en_16k_nq32ds640-* - split: speech_tokenizer_16k path: data/speech_tokenizer_16k-* dataset_info: features: - name: audio dtype: audio: sampling_rate: 16000 - name: id dtype: string splits: - name: original num_bytes: 40151638.0 num_examples: 217 - name: academicodec_hifi_16k_320d num_bytes: 40096637.0 num_examples: 217 - name: academicodec_hifi_16k_320d_large_uni num_bytes: 40096637.0 num_examples: 217 - name: academicodec_hifi_24k_320d num_bytes: 60154877.0 num_examples: 217 - name: audiodec_24k_320d num_bytes: 60275237.0 num_examples: 217 - name: dac_16k num_bytes: 40151855.0 num_examples: 217 - name: dac_24k num_bytes: 60219467.0 num_examples: 217 - name: dac_44k num_bytes: 110639439.0 num_examples: 217 - name: encodec_24k_12bps num_bytes: 60219467.0 num_examples: 217 - name: encodec_24k_1_5bps num_bytes: 60219467.0 num_examples: 217 - name: encodec_24k_24bps num_bytes: 60219467.0 num_examples: 217 - name: encodec_24k_3bps num_bytes: 60219467.0 num_examples: 217 - name: encodec_24k_6bps num_bytes: 60219467.0 num_examples: 217 - name: funcodec_en_libritts_16k_gr1nq32ds320 num_bytes: 40143099.0 num_examples: 217 - name: funcodec_en_libritts_16k_gr8nq32ds320 num_bytes: 40143099.0 num_examples: 217 - name: funcodec_en_libritts_16k_nq32ds320 num_bytes: 40151855.0 num_examples: 217 - name: funcodec_en_libritts_16k_nq32ds640 num_bytes: 40151855.0 num_examples: 217 - name: funcodec_zh_en_16k_nq32ds320 num_bytes: 40151855.0 num_examples: 217 - name: funcodec_zh_en_16k_nq32ds640 num_bytes: 40151855.0 num_examples: 217 - name: speech_tokenizer_16k num_bytes: 40206077.0 num_examples: 217 download_size: 1017913637 dataset_size: 1033982817.0 --- # Dataset Card for "m4singer_synth" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

配置项： - 配置名称：default 数据文件： - 划分集：original 路径：data/original-* - 划分集：academicodec_hifi_16k_320d 路径：data/academicodec_hifi_16k_320d-* - 划分集：academicodec_hifi_16k_320d_large_uni 路径：data/academicodec_hifi_16k_320d_large_uni-* - 划分集：academicodec_hifi_24k_320d 路径：data/academicodec_hifi_24k_320d-* - 划分集：audiodec_24k_320d 路径：data/audiodec_24k_320d-* - 划分集：dac_16k 路径：data/dac_16k-* - 划分集：dac_24k 路径：data/dac_24k-* - 划分集：dac_44k 路径：data/dac_44k-* - 划分集：encodec_24k_12bps 路径：data/encodec_24k_12bps-* - 划分集：encodec_24k_1_5bps 路径：data/encodec_24k_1_5bps-* - 划分集：encodec_24k_24bps 路径：data/encodec_24k_24bps-* - 划分集：encodec_24k_3bps 路径：data/encodec_24k_3bps-* - 划分集：encodec_24k_6bps 路径：data/encodec_24k_6bps-* - 划分集：funcodec_en_libritts_16k_gr1nq32ds320 路径：data/funcodec_en_libritts_16k_gr1nq32ds320-* - 划分集：funcodec_en_libritts_16k_gr8nq32ds320 路径：data/funcodec_en_libritts_16k_gr8nq32ds320-* - 划分集：funcodec_en_libritts_16k_nq32ds320 路径：data/funcodec_en_libritts_16k_nq32ds320-* - 划分集：funcodec_en_libritts_16k_nq32ds640 路径：data/funcodec_en_libritts_16k_nq32ds640-* - 划分集：funcodec_zh_en_16k_nq32ds320 路径：data/funcodec_zh_en_16k_nq32ds320-* - 划分集：funcodec_zh_en_16k_nq32ds640 路径：data/funcodec_zh_en_16k_nq32ds640-* - 划分集：speech_tokenizer_16k 路径：data/speech_tokenizer_16k-* 数据集信息：特征： - 名称：audio 数据类型：音频：采样率：16000 - 名称：id 数据类型：字符串划分集： - 名称：original 字节数：40151638.0 样本数：217 - 名称：academicodec_hifi_16k_320d 字节数：40096637.0 样本数：217 - 名称：academicodec_hifi_16k_320d_large_uni 字节数：40096637.0 样本数：217 - 名称：academicodec_hifi_24k_320d 字节数：60154877.0 样本数：217 - 名称：audiodec_24k_320d 字节数：60275237.0 样本数：217 - 名称：dac_16k 字节数：40151855.0 样本数：217 - 名称：dac_24k 字节数：60219467.0 样本数：217 - 名称：dac_44k 字节数：110639439.0 样本数：217 - 名称：encodec_24k_12bps 字节数：60219467.0 样本数：217 - 名称：encodec_24k_1_5bps 字节数：60219467.0 样本数：217 - 名称：encodec_24k_24bps 字节数：60219467.0 样本数：217 - 名称：encodec_24k_3bps 字节数：60219467.0 样本数：217 - 名称：encodec_24k_6bps 字节数：60219467.0 样本数：217 - 名称：funcodec_en_libritts_16k_gr1nq32ds320 字节数：40143099.0 样本数：217 - 名称：funcodec_en_libritts_16k_gr8nq32ds320 字节数：40143099.0 样本数：217 - 名称：funcodec_en_libritts_16k_nq32ds320 字节数：40151855.0 样本数：217 - 名称：funcodec_en_libritts_16k_nq32ds640 字节数：40151855.0 样本数：217 - 名称：funcodec_zh_en_16k_nq32ds320 字节数：40151855.0 样本数：217 - 名称：funcodec_zh_en_16k_nq32ds640 字节数：40151855.0 样本数：217 - 名称：speech_tokenizer_16k 字节数：40206077.0 样本数：217 下载大小：1017913637 数据集总大小：1033982817.0 --- # 「m4singer_synth」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

Codec-SUPERB

原始信息汇总

数据集概述

数据集配置

默认配置：
- 数据文件路径：
  - original：data/original-*
  - academicodec_hifi_16k_320d：data/academicodec_hifi_16k_320d-*
  - academicodec_hifi_16k_320d_large_uni：data/academicodec_hifi_16k_320d_large_uni-*
  - academicodec_hifi_24k_320d：data/academicodec_hifi_24k_320d-*
  - audiodec_24k_320d：data/audiodec_24k_320d-*
  - dac_16k：data/dac_16k-*
  - dac_24k：data/dac_24k-*
  - dac_44k：data/dac_44k-*
  - encodec_24k_12bps：data/encodec_24k_12bps-*
  - encodec_24k_1_5bps：data/encodec_24k_1_5bps-*
  - encodec_24k_24bps：data/encodec_24k_24bps-*
  - encodec_24k_3bps：data/encodec_24k_3bps-*
  - encodec_24k_6bps：data/encodec_24k_6bps-*
  - funcodec_en_libritts_16k_gr1nq32ds320：data/funcodec_en_libritts_16k_gr1nq32ds320-*
  - funcodec_en_libritts_16k_gr8nq32ds320：data/funcodec_en_libritts_16k_gr8nq32ds320-*
  - funcodec_en_libritts_16k_nq32ds320：data/funcodec_en_libritts_16k_nq32ds320-*
  - funcodec_en_libritts_16k_nq32ds640：data/funcodec_en_libritts_16k_nq32ds640-*
  - funcodec_zh_en_16k_nq32ds320：data/funcodec_zh_en_16k_nq32ds320-*
  - funcodec_zh_en_16k_nq32ds640：data/funcodec_zh_en_16k_nq32ds640-*
  - speech_tokenizer_16k：data/speech_tokenizer_16k-*

数据集信息

特征：
- audio：采样率为16000
- id：字符串类型
分割：
- original：40151638字节，217个样本
- academicodec_hifi_16k_320d：40096637字节，217个样本
- academicodec_hifi_16k_320d_large_uni：40096637字节，217个样本
- academicodec_hifi_24k_320d：60154877字节，217个样本
- audiodec_24k_320d：60275237字节，217个样本
- dac_16k：40151855字节，217个样本
- dac_24k：60219467字节，217个样本
- dac_44k：110639439字节，217个样本
- encodec_24k_12bps：60219467字节，217个样本
- encodec_24k_1_5bps：60219467字节，217个样本
- encodec_24k_24bps：60219467字节，217个样本
- encodec_24k_3bps：60219467字节，217个样本
- encodec_24k_6bps：60219467字节，217个样本
- funcodec_en_libritts_16k_gr1nq32ds320：40143099字节，217个样本
- funcodec_en_libritts_16k_gr8nq32ds320：40143099字节，217个样本
- funcodec_en_libritts_16k_nq32ds320：40151855字节，217个样本
- funcodec_en_libritts_16k_nq32ds640：40151855字节，217个样本
- funcodec_zh_en_16k_nq32ds320：40151855字节，217个样本
- funcodec_zh_en_16k_nq32ds640：40151855字节，217个样本
- speech_tokenizer_16k：40206077字节，217个样本
数据集大小：
- 下载大小：1017913637字节
- 数据集大小：1033982817字节

搜集汇总

数据集介绍

构建方式

Codec-SUPERB/m4singer_synth数据集的构建，主要依托于多种音频编码技术的应用，涵盖了不同采样率和编码参数的音频文件。该数据集包含了原始音频及其经过多种编码技术处理后的版本，旨在为语音合成和编码算法的研究提供丰富的实验素材。数据集的构建过程涉及音频的采样、编码和存储，确保了音频质量和多样性的双重保障。

特点

该数据集的特点在于其多样性及针对性，不仅包含了未经处理的原始音频数据，还包括了采用不同编码技术处理后的音频数据，如academicodec、audiodec、funcodec等。这些音频数据覆盖了从16k到44k的采样率，以及不同的编码速率，为研究者提供了广泛的实验选择。此外，数据集的标准化处理使得各数据子集之间具有可比性，便于进行跨技术的性能评估。

使用方法

使用Codec-SUPERB/m4singer_synth数据集时，用户可以根据需要选择不同split的数据文件。每个split代表了不同的音频处理方式或采样率。用户可以下载整个数据集或单个split，然后利用相应的音频处理工具进行读取和分析。此外，数据集提供的id字段可以用于追踪和标识每个音频样本，便于研究者在实验中的数据管理。

背景与挑战

背景概述

Codec-SUPERB/m4singer_synth数据集，是在音频处理与合成研究领域的一项重要成果，由Codec-SUPERB团队创建于近年。该数据集的主要研究人员来自学术界，致力于解决语音合成中的自然度和质量问题。数据集包含了多种不同编码和解码配置的音频样本，旨在为研究者提供一个综合性的测试平台，以评估和比较不同编码器的性能。其影响力在语音合成和音频处理领域逐渐显现，成为评估新型音频编解码技术的重要基准。

当前挑战

该数据集在构建过程中面临的挑战主要涉及两个方面：一是音频数据的高质量采集与处理，以确保实验结果的准确性和可靠性；二是数据集的多样性构建，涵盖了不同的编码率和解码配置，以满足不同研究需求的挑战。在所解决的领域问题方面，m4singer_synth数据集的挑战在于，如何在保持音频质量的同时，有效降低数据的大小和传输成本，这对于移动设备和云计算环境中的实时音频处理尤为重要。

常用场景

经典使用场景

在音频信号处理领域，Codec-SUPERB/m4singer_synth数据集被广泛应用于声音合成与编解码技术的评估与优化。该数据集提供了多种不同编码格式与采样率的声音文件，使得研究人员能够对比分析不同编解码器在音质保持与数据压缩方面的性能。

解决学术问题

该数据集解决了声音编码中的音质损失与数据压缩效率之间的权衡问题，为学术研究提供了可靠的数据基础。通过这一数据集，研究者能够量化不同编解码器对音质的影响，进而优化编解码算法，提高声音传输与存储的效率。

衍生相关工作

基于该数据集，学术界已经衍生出一系列相关工作，如编解码算法的改进、音质评估指标的研究以及语音合成系统的开发等，这些研究进一步推动了音频信号处理技术的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集