VocalnetOpenDataset|歌声合成数据集|国风音乐数据集

github2020-12-28 更新2024-05-31 收录

歌声合成

国风音乐

下载链接：

https://github.com/Liu-Feng-deeplearning/VocalnetOpenDataset

下载链接

链接失效反馈

资源简介：

一个开源的中文歌声合成数据集，包含多种国风类音乐，部分歌曲含有戏腔唱段。数据集分为主数据集和用于训练nn-vocoder的零散音频两部分。主数据集中包含多首完整或部分歌曲，共多条轨道。

An open-source Chinese singing voice synthesis dataset, encompassing a variety of traditional Chinese music styles, with some songs featuring operatic singing segments. The dataset is divided into two parts: the main dataset and scattered audio files for training the nn-vocoder. The main dataset includes multiple complete or partial songs, comprising numerous tracks.

创建时间：

2020-07-14

原始信息汇总

VocalnetOpenDataset 概述

数据集描述

类型: 中文歌声合成数据集
许可: 采用Creative Commons Attribution Share Alike 4.0 International协议，允许商业使用和再发布，但需对数据集进行署名。

音频特性

采样率: 32000Hz
位深度: 16bit
声道: 单声道
音质: 录音室级，已进行噪声门处理
组成: 每首歌曲可能包含多条音轨

数据集内容

主数据集:
- 包含多首完整或部分歌曲，具体数量未提供
- 曲风偏向国风，可能包含戏腔唱段
- 不提供歌词，需自行收集
零散数据集:
- 去除静音后的总时长未提供
- 已拼合为单个音频文件，可自行切割
- 内容可能重复，未经过人工处理

标注情况

已完成部分手工对齐和句子划分
使用Praat的TextGrid格式，未来将提供其他格式
标注工作正在进行中，欢迎志愿者贡献

AI搜集汇总

数据集介绍

构建方式

VocalnetOpenDataset的构建过程体现了对高质量音频数据的严格筛选与处理。该数据集以32000Hz采样率、16bit深度、单声道格式收录了录音室级别的音频，确保音质的高保真度。数据集分为主数据集和零散音频两部分，主数据集包含多首完整或部分歌曲，涵盖不同曲风，尤其是国风类音乐，部分歌曲还包含戏腔唱段。零散音频则经过静音去除处理，拼合为单个文件，供进一步切割使用。标注工作部分完成，采用Praat的TextGrid格式，未来计划提供更多格式支持。

特点

VocalnetOpenDataset的特点在于其多样化的曲风和高质量的音频数据。主数据集中的歌曲风格以国风为主，同时包含其他曲风，展现了丰富的音乐多样性。部分歌曲中的戏腔唱段为研究特定唱法提供了独特资源。零散音频数据集则提供了经过静音处理的音频片段，便于训练特定模型。此外，数据集以Creative Commons Attribution Share Alike 4.0 International协议共享，允许商业使用和模型发布，为研究者和开发者提供了极大的灵活性。

使用方法

VocalnetOpenDataset的使用方法灵活多样，适用于歌声合成、音色转换等研究领域。主数据集可用于训练歌声合成模型，尤其是针对国风音乐的合成任务。零散音频数据集则适合用于训练神经网络声码器（nn-vocoder），提升音频生成质量。用户可根据需求自行切割零散音频文件，或利用提供的TextGrid标注进行对齐和音符音高分析。数据集的开源协议允许用户将训练模型和合成音频用于商业用途，但需遵循署名要求。未来，随着标注工作的完善，数据集的应用范围将进一步扩展。

背景与挑战

背景概述

VocalnetOpenDataset是由xushengyuan和wenren于2019年创建的一个开源中文歌声合成数据集，旨在为中文歌声合成研究提供高质量的音频资源。该数据集包含录音室级别的音频，采样率为32000Hz，16bit，单声道，并经过噪声门处理。数据集分为主数据集和零散音频两部分，主数据集包含多首完整或部分歌曲，曲风以国风为主，部分歌曲包含戏腔唱段。该数据集的发布为中文歌声合成领域的研究提供了重要的数据支持，推动了该领域的技术发展。

当前挑战

VocalnetOpenDataset在构建过程中面临多重挑战。首先，数据集的标注工作尚未完全完成，尤其是音符音高的标注和句子划分仍需进一步完善，这对模型的训练和评估带来了不确定性。其次，由于版权限制，数据集未提供歌词，研究者需自行收集，增加了使用难度。此外，数据集中的曲风差异较大，部分歌曲包含戏腔唱段，可能对模型的泛化能力提出更高要求。最后，零散音频部分存在一定的重复内容，且未经过人工处理，可能影响数据质量。这些挑战需要在后续的研究和开发中逐步解决。

常用场景

经典使用场景

VocalnetOpenDataset作为一个开源的中文歌声合成数据集，广泛应用于歌声合成技术的研究与开发。该数据集特别适用于训练和评估基于深度学习的歌声合成模型，如WaveNet和WaveGlow等。研究者可以利用该数据集中的高质量音频数据，探索如何生成更加自然和逼真的歌声。

解决学术问题

VocalnetOpenDataset解决了中文歌声合成领域中高质量训练数据稀缺的问题。通过提供录音室级别的音频数据，该数据集为研究者提供了一个标准化的基准，用于比较不同歌声合成算法的性能。此外，数据集中的多样曲风和戏腔唱段也为研究者在不同音乐风格下的歌声合成提供了丰富的素材。

衍生相关工作

VocalnetOpenDataset的发布促进了多个相关领域的研究进展。基于该数据集，研究者开发了多种先进的歌声合成模型，如基于WaveNet的歌声合成器和基于WaveGlow的声码器。这些模型在学术界和工业界都得到了广泛应用，推动了歌声合成技术的发展。此外，该数据集还激发了更多关于中文歌声合成的研究，为未来的创新提供了坚实的基础。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

Matchesfashion, Ltd. eCommerce insights

The eCommerce activity of Matchesfashion, Ltd. amounted to US$410m in 2023. Learn more about their online business including detailed eCommerce revenue analytics.

ecommercedb.com 收录

DOLPHINS

DOLPHINS数据集是由清华大学电子工程系创建的一个大规模、多场景、多视角、多模态的自动驾驶数据集。该数据集包含42376帧图像和点云数据，涵盖6种典型自动驾驶场景，如城市交叉口、T型路口等，并考虑了动态天气条件。数据集通过CARLA模拟器生成，确保了数据的多样性和真实性。DOLPHINS数据集旨在支持车辆间（V2V）和车辆与基础设施间（V2I）的协同感知研究，解决自动驾驶中的盲区和长距离感知问题，推动互联自动驾驶技术的发展。

arXiv 收录

TimeExtractor

该数据集由JioNLP创建，旨在微调大型语言模型（LLMs）以从文本中提取时间实体，并将其标准化为JSON格式。数据集分为两部分：general.json包含从各种新闻来源提取的样本，smartspeaker.json包含从语音助手获取的样本。提取过程首先从文本中提取原始时间实体字符串，然后通过大型模型进行标准化处理，最终结果可以输入到JioNLP的时间解析模块jio.parse中进行处理，以获得准确可靠的结果。数据集目前规模较小，未来可以通过添加各种类型的文本来扩展。

huggingface 收录

AerialMegaDepth

AerialMegaDepth数据集是由卡内基梅隆大学研究者创建的，该数据集结合了伪合成渲染和真实地面图像，旨在推进从地面和空中视角的图像中学习几何重建和视图合成任务。数据集通过将3D城市级网格的伪合成渲染与来自MegaDepth的真实地面级图像在统一坐标系中注册，包含了137个地标和132,137个地理注册图像。该数据集在具有挑战性的地面-空中场景中，显著提高了基于学习的方法在多视图几何预测和新型视图合成任务上的性能。

arXiv 收录

FishBase Species List

FishBase Species List 是一个包含全球鱼类物种信息的全面数据库。该数据集提供了关于鱼类物种的详细信息，包括物种名称、分类学信息、分布区域、生态习性、繁殖行为、食性等。此外，数据集还包括了每个物种的图片和参考文献，以便用户进行深入研究。