lyrics-aligned-solo-singing-dataset

收藏

github2023-06-26 更新2024-05-31 收录

下载链接：

https://github.com/chitralekha18/lyrics-aligned-solo-singing-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于论文Semi-supervised lyrics and solo-singing alignment，包含训练和测试数据，分别包含35662和1697个wav文件，以及相应的歌词转录文本。数据集主要用于研究目的，特别是音乐信息检索领域。

This dataset is utilized for the paper titled 'Semi-supervised lyrics and solo-singing alignment'. It encompasses both training and testing data, comprising 35,662 and 1,697 WAV files respectively, along with corresponding lyric transcriptions. The dataset is primarily intended for research purposes, particularly within the realm of music information retrieval.

创建时间：

2018-12-17

原始信息汇总

数据集概述

数据集名称

Lyrics-aligned solo singing dataset

数据集用途

用于研究论文 "Semi-supervised lyrics and solo-singing alignment"，作者为 Chitralekha Gupta, Rong Tong, Haizhou Li, 和 Ye Wang，发表于 ISMIR 2018。

数据集内容

训练集（Train Set）：包含35662个wav文件，来自132首独特的歌曲，每首歌曲有不同数量的约10秒音频片段。
测试集（Test Set）：包含1697个wav文件，来自25首独特的歌曲，每首歌曲有不同数量的约10秒音频片段。

文件描述

train.txt 和 test.txt：包含自动生成的歌词转录文本，对应于训练集和测试集中的音频文件。

数据集结构

训练集：
- 包含132首歌曲，每首歌曲的音频片段数量如下：
  - [_losing_my_religion: 534, _apologize: 210, ...]
测试集：
- 包含25首歌曲，每首歌曲的音频片段数量如下：
  - [_true_colors: 54, _hashtag_that_power: 73, ...]

联系信息

如有疑问，请联系 chitralekha@u.nus.edu。

使用许可

该数据集仅供研究使用。

搜集汇总

数据集介绍

main_image_url

构建方式

该数据集基于Smule的DAMP数据集构建，通过从中提取独唱音频片段，并自动生成对应的歌词转录。训练集包含35662个音频文件，测试集包含1697个音频文件。每个音频片段时长约为10秒，涵盖了132首独特的歌曲。数据集的生成过程在相关论文中详细描述，代码也已开源，供研究社区进一步使用和改进。

特点

该数据集的特点在于其专注于独唱音频与歌词的对齐任务，适用于音乐信息检索领域的研究。训练集和测试集分别包含不同歌曲的音频片段，确保了数据的多样性和独立性。每个音频片段均配有自动生成的歌词转录，为研究者提供了丰富的标注数据。此外，训练集在论文发布后进一步扩展，增加了更多音频文件，为后续研究提供了更广泛的数据支持。

使用方法

该数据集主要用于音乐信息检索领域的研究，特别是歌词与独唱音频的对齐任务。研究者可以通过训练集和测试集中的音频文件及其对应的歌词转录，开发或评估相关算法。数据集的使用需遵循研究目的，且需引用相关论文以尊重原始贡献者。对于进一步的使用或疑问，可通过提供的联系方式与数据集作者取得联系。

背景与挑战

背景概述

Lyrics-aligned solo singing dataset 是由Chitralekha Gupta、Rong Tong、Haizhou Li和Ye Wang等研究人员于2018年创建的一个音乐信息检索（MIR）领域的重要数据集。该数据集主要用于研究歌词与独唱音频的对齐问题，旨在通过半监督学习方法提升对齐精度。数据集的音频片段来源于Smule的DAMP数据集，包含训练集和测试集，分别包含35662和1697个音频文件。该数据集的发布为音乐信息检索领域的研究提供了宝贵的资源，尤其在歌词与音频对齐的自动化处理方面具有重要的学术价值。

当前挑战

Lyrics-aligned solo singing dataset 面临的挑战主要集中在两个方面。首先，歌词与音频的对齐问题本身具有较高的复杂性，尤其是在处理不同语言、音调和节奏变化的独唱音频时，对齐精度难以保证。其次，数据集的构建过程中，自动生成歌词转录的准确性依赖于复杂的算法，而这些算法在处理噪声、背景音乐干扰以及发音不清晰的情况下表现不佳，导致数据质量可能存在一定偏差。此外，数据集的多样性和规模虽然为研究提供了丰富的素材，但也增加了模型训练的复杂性和计算成本。

常用场景

经典使用场景

在音乐信息检索（MIR）领域，lyrics-aligned solo singing dataset 数据集被广泛用于歌词与独唱音频的对齐研究。该数据集包含了大量从Smule的DAMP数据集中提取的音频片段，并附有自动生成的歌词转录。研究者可以利用这些数据开发算法，实现歌词与音频的精确对齐，从而提升音乐检索和推荐系统的性能。

实际应用

在实际应用中，lyrics-aligned solo singing dataset 数据集为音乐流媒体平台和卡拉OK应用提供了技术支持。通过精确的歌词对齐，用户可以在播放音乐时实时查看歌词，提升用户体验。此外，该数据集还可用于开发智能音乐教育工具，帮助学习者更好地理解歌曲结构和发音。

衍生相关工作

基于该数据集，研究者们开发了多种经典算法和模型。例如，Chitralekha Gupta等人提出的半监督歌词对齐方法已成为该领域的基准工作。此外，该数据集还激发了更多关于音频与文本对齐的研究，推动了音乐信息检索、语音识别和自然语言处理等领域的交叉创新。

以上内容由遇见数据集搜集并总结生成

© 2023-2026 上海数据发展科技有限责任公司版权所有

沪ICP备17003045号-15 沪公网安备31010402336585号

二维码

社区交流群

二维码

科研交流群

商业服务