Codec-SUPERB/m4singer_synth
收藏Hugging Face2024-02-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Codec-SUPERB/m4singer_synth
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: original
path: data/original-*
- split: academicodec_hifi_16k_320d
path: data/academicodec_hifi_16k_320d-*
- split: academicodec_hifi_16k_320d_large_uni
path: data/academicodec_hifi_16k_320d_large_uni-*
- split: academicodec_hifi_24k_320d
path: data/academicodec_hifi_24k_320d-*
- split: audiodec_24k_320d
path: data/audiodec_24k_320d-*
- split: dac_16k
path: data/dac_16k-*
- split: dac_24k
path: data/dac_24k-*
- split: dac_44k
path: data/dac_44k-*
- split: encodec_24k_12bps
path: data/encodec_24k_12bps-*
- split: encodec_24k_1_5bps
path: data/encodec_24k_1_5bps-*
- split: encodec_24k_24bps
path: data/encodec_24k_24bps-*
- split: encodec_24k_3bps
path: data/encodec_24k_3bps-*
- split: encodec_24k_6bps
path: data/encodec_24k_6bps-*
- split: funcodec_en_libritts_16k_gr1nq32ds320
path: data/funcodec_en_libritts_16k_gr1nq32ds320-*
- split: funcodec_en_libritts_16k_gr8nq32ds320
path: data/funcodec_en_libritts_16k_gr8nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds320
path: data/funcodec_en_libritts_16k_nq32ds320-*
- split: funcodec_en_libritts_16k_nq32ds640
path: data/funcodec_en_libritts_16k_nq32ds640-*
- split: funcodec_zh_en_16k_nq32ds320
path: data/funcodec_zh_en_16k_nq32ds320-*
- split: funcodec_zh_en_16k_nq32ds640
path: data/funcodec_zh_en_16k_nq32ds640-*
- split: speech_tokenizer_16k
path: data/speech_tokenizer_16k-*
dataset_info:
features:
- name: audio
dtype:
audio:
sampling_rate: 16000
- name: id
dtype: string
splits:
- name: original
num_bytes: 40151638.0
num_examples: 217
- name: academicodec_hifi_16k_320d
num_bytes: 40096637.0
num_examples: 217
- name: academicodec_hifi_16k_320d_large_uni
num_bytes: 40096637.0
num_examples: 217
- name: academicodec_hifi_24k_320d
num_bytes: 60154877.0
num_examples: 217
- name: audiodec_24k_320d
num_bytes: 60275237.0
num_examples: 217
- name: dac_16k
num_bytes: 40151855.0
num_examples: 217
- name: dac_24k
num_bytes: 60219467.0
num_examples: 217
- name: dac_44k
num_bytes: 110639439.0
num_examples: 217
- name: encodec_24k_12bps
num_bytes: 60219467.0
num_examples: 217
- name: encodec_24k_1_5bps
num_bytes: 60219467.0
num_examples: 217
- name: encodec_24k_24bps
num_bytes: 60219467.0
num_examples: 217
- name: encodec_24k_3bps
num_bytes: 60219467.0
num_examples: 217
- name: encodec_24k_6bps
num_bytes: 60219467.0
num_examples: 217
- name: funcodec_en_libritts_16k_gr1nq32ds320
num_bytes: 40143099.0
num_examples: 217
- name: funcodec_en_libritts_16k_gr8nq32ds320
num_bytes: 40143099.0
num_examples: 217
- name: funcodec_en_libritts_16k_nq32ds320
num_bytes: 40151855.0
num_examples: 217
- name: funcodec_en_libritts_16k_nq32ds640
num_bytes: 40151855.0
num_examples: 217
- name: funcodec_zh_en_16k_nq32ds320
num_bytes: 40151855.0
num_examples: 217
- name: funcodec_zh_en_16k_nq32ds640
num_bytes: 40151855.0
num_examples: 217
- name: speech_tokenizer_16k
num_bytes: 40206077.0
num_examples: 217
download_size: 1017913637
dataset_size: 1033982817.0
---
# Dataset Card for "m4singer_synth"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 划分集:original
路径:data/original-*
- 划分集:academicodec_hifi_16k_320d
路径:data/academicodec_hifi_16k_320d-*
- 划分集:academicodec_hifi_16k_320d_large_uni
路径:data/academicodec_hifi_16k_320d_large_uni-*
- 划分集:academicodec_hifi_24k_320d
路径:data/academicodec_hifi_24k_320d-*
- 划分集:audiodec_24k_320d
路径:data/audiodec_24k_320d-*
- 划分集:dac_16k
路径:data/dac_16k-*
- 划分集:dac_24k
路径:data/dac_24k-*
- 划分集:dac_44k
路径:data/dac_44k-*
- 划分集:encodec_24k_12bps
路径:data/encodec_24k_12bps-*
- 划分集:encodec_24k_1_5bps
路径:data/encodec_24k_1_5bps-*
- 划分集:encodec_24k_24bps
路径:data/encodec_24k_24bps-*
- 划分集:encodec_24k_3bps
路径:data/encodec_24k_3bps-*
- 划分集:encodec_24k_6bps
路径:data/encodec_24k_6bps-*
- 划分集:funcodec_en_libritts_16k_gr1nq32ds320
路径:data/funcodec_en_libritts_16k_gr1nq32ds320-*
- 划分集:funcodec_en_libritts_16k_gr8nq32ds320
路径:data/funcodec_en_libritts_16k_gr8nq32ds320-*
- 划分集:funcodec_en_libritts_16k_nq32ds320
路径:data/funcodec_en_libritts_16k_nq32ds320-*
- 划分集:funcodec_en_libritts_16k_nq32ds640
路径:data/funcodec_en_libritts_16k_nq32ds640-*
- 划分集:funcodec_zh_en_16k_nq32ds320
路径:data/funcodec_zh_en_16k_nq32ds320-*
- 划分集:funcodec_zh_en_16k_nq32ds640
路径:data/funcodec_zh_en_16k_nq32ds640-*
- 划分集:speech_tokenizer_16k
路径:data/speech_tokenizer_16k-*
数据集信息:
特征:
- 名称:audio
数据类型:
音频:
采样率:16000
- 名称:id
数据类型:字符串
划分集:
- 名称:original
字节数:40151638.0
样本数:217
- 名称:academicodec_hifi_16k_320d
字节数:40096637.0
样本数:217
- 名称:academicodec_hifi_16k_320d_large_uni
字节数:40096637.0
样本数:217
- 名称:academicodec_hifi_24k_320d
字节数:60154877.0
样本数:217
- 名称:audiodec_24k_320d
字节数:60275237.0
样本数:217
- 名称:dac_16k
字节数:40151855.0
样本数:217
- 名称:dac_24k
字节数:60219467.0
样本数:217
- 名称:dac_44k
字节数:110639439.0
样本数:217
- 名称:encodec_24k_12bps
字节数:60219467.0
样本数:217
- 名称:encodec_24k_1_5bps
字节数:60219467.0
样本数:217
- 名称:encodec_24k_24bps
字节数:60219467.0
样本数:217
- 名称:encodec_24k_3bps
字节数:60219467.0
样本数:217
- 名称:encodec_24k_6bps
字节数:60219467.0
样本数:217
- 名称:funcodec_en_libritts_16k_gr1nq32ds320
字节数:40143099.0
样本数:217
- 名称:funcodec_en_libritts_16k_gr8nq32ds320
字节数:40143099.0
样本数:217
- 名称:funcodec_en_libritts_16k_nq32ds320
字节数:40151855.0
样本数:217
- 名称:funcodec_en_libritts_16k_nq32ds640
字节数:40151855.0
样本数:217
- 名称:funcodec_zh_en_16k_nq32ds320
字节数:40151855.0
样本数:217
- 名称:funcodec_zh_en_16k_nq32ds640
字节数:40151855.0
样本数:217
- 名称:speech_tokenizer_16k
字节数:40206077.0
样本数:217
下载大小:1017913637
数据集总大小:1033982817.0
---
# 「m4singer_synth」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Codec-SUPERB
原始信息汇总
数据集概述
数据集配置
- 默认配置:
- 数据文件路径:
original:data/original-*academicodec_hifi_16k_320d:data/academicodec_hifi_16k_320d-*academicodec_hifi_16k_320d_large_uni:data/academicodec_hifi_16k_320d_large_uni-*academicodec_hifi_24k_320d:data/academicodec_hifi_24k_320d-*audiodec_24k_320d:data/audiodec_24k_320d-*dac_16k:data/dac_16k-*dac_24k:data/dac_24k-*dac_44k:data/dac_44k-*encodec_24k_12bps:data/encodec_24k_12bps-*encodec_24k_1_5bps:data/encodec_24k_1_5bps-*encodec_24k_24bps:data/encodec_24k_24bps-*encodec_24k_3bps:data/encodec_24k_3bps-*encodec_24k_6bps:data/encodec_24k_6bps-*funcodec_en_libritts_16k_gr1nq32ds320:data/funcodec_en_libritts_16k_gr1nq32ds320-*funcodec_en_libritts_16k_gr8nq32ds320:data/funcodec_en_libritts_16k_gr8nq32ds320-*funcodec_en_libritts_16k_nq32ds320:data/funcodec_en_libritts_16k_nq32ds320-*funcodec_en_libritts_16k_nq32ds640:data/funcodec_en_libritts_16k_nq32ds640-*funcodec_zh_en_16k_nq32ds320:data/funcodec_zh_en_16k_nq32ds320-*funcodec_zh_en_16k_nq32ds640:data/funcodec_zh_en_16k_nq32ds640-*speech_tokenizer_16k:data/speech_tokenizer_16k-*
- 数据文件路径:
数据集信息
-
特征:
audio:采样率为16000id:字符串类型
-
分割:
original:40151638字节,217个样本academicodec_hifi_16k_320d:40096637字节,217个样本academicodec_hifi_16k_320d_large_uni:40096637字节,217个样本academicodec_hifi_24k_320d:60154877字节,217个样本audiodec_24k_320d:60275237字节,217个样本dac_16k:40151855字节,217个样本dac_24k:60219467字节,217个样本dac_44k:110639439字节,217个样本encodec_24k_12bps:60219467字节,217个样本encodec_24k_1_5bps:60219467字节,217个样本encodec_24k_24bps:60219467字节,217个样本encodec_24k_3bps:60219467字节,217个样本encodec_24k_6bps:60219467字节,217个样本funcodec_en_libritts_16k_gr1nq32ds320:40143099字节,217个样本funcodec_en_libritts_16k_gr8nq32ds320:40143099字节,217个样本funcodec_en_libritts_16k_nq32ds320:40151855字节,217个样本funcodec_en_libritts_16k_nq32ds640:40151855字节,217个样本funcodec_zh_en_16k_nq32ds320:40151855字节,217个样本funcodec_zh_en_16k_nq32ds640:40151855字节,217个样本speech_tokenizer_16k:40206077字节,217个样本
-
数据集大小:
- 下载大小:1017913637字节
- 数据集大小:1033982817字节
搜集汇总
数据集介绍

构建方式
Codec-SUPERB/m4singer_synth数据集的构建,主要依托于多种音频编码技术的应用,涵盖了不同采样率和编码参数的音频文件。该数据集包含了原始音频及其经过多种编码技术处理后的版本,旨在为语音合成和编码算法的研究提供丰富的实验素材。数据集的构建过程涉及音频的采样、编码和存储,确保了音频质量和多样性的双重保障。
特点
该数据集的特点在于其多样性及针对性,不仅包含了未经处理的原始音频数据,还包括了采用不同编码技术处理后的音频数据,如academicodec、audiodec、funcodec等。这些音频数据覆盖了从16k到44k的采样率,以及不同的编码速率,为研究者提供了广泛的实验选择。此外,数据集的标准化处理使得各数据子集之间具有可比性,便于进行跨技术的性能评估。
使用方法
使用Codec-SUPERB/m4singer_synth数据集时,用户可以根据需要选择不同split的数据文件。每个split代表了不同的音频处理方式或采样率。用户可以下载整个数据集或单个split,然后利用相应的音频处理工具进行读取和分析。此外,数据集提供的id字段可以用于追踪和标识每个音频样本,便于研究者在实验中的数据管理。
背景与挑战
背景概述
Codec-SUPERB/m4singer_synth数据集,是在音频处理与合成研究领域的一项重要成果,由Codec-SUPERB团队创建于近年。该数据集的主要研究人员来自学术界,致力于解决语音合成中的自然度和质量问题。数据集包含了多种不同编码和解码配置的音频样本,旨在为研究者提供一个综合性的测试平台,以评估和比较不同编码器的性能。其影响力在语音合成和音频处理领域逐渐显现,成为评估新型音频编解码技术的重要基准。
当前挑战
该数据集在构建过程中面临的挑战主要涉及两个方面:一是音频数据的高质量采集与处理,以确保实验结果的准确性和可靠性;二是数据集的多样性构建,涵盖了不同的编码率和解码配置,以满足不同研究需求的挑战。在所解决的领域问题方面,m4singer_synth数据集的挑战在于,如何在保持音频质量的同时,有效降低数据的大小和传输成本,这对于移动设备和云计算环境中的实时音频处理尤为重要。
常用场景
经典使用场景
在音频信号处理领域,Codec-SUPERB/m4singer_synth数据集被广泛应用于声音合成与编解码技术的评估与优化。该数据集提供了多种不同编码格式与采样率的声音文件,使得研究人员能够对比分析不同编解码器在音质保持与数据压缩方面的性能。
解决学术问题
该数据集解决了声音编码中的音质损失与数据压缩效率之间的权衡问题,为学术研究提供了可靠的数据基础。通过这一数据集,研究者能够量化不同编解码器对音质的影响,进而优化编解码算法,提高声音传输与存储的效率。
衍生相关工作
基于该数据集,学术界已经衍生出一系列相关工作,如编解码算法的改进、音质评估指标的研究以及语音合成系统的开发等,这些研究进一步推动了音频信号处理技术的发展。
以上内容由遇见数据集搜集并总结生成



