turkish_makam_vocal_segments_dataset

github2020-06-16 更新2024-05-31 收录

下载链接：

https://github.com/MTG/turkish_makam_vocal_segments_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

土耳其马卡姆声乐片段数据集的手动注释，包括与乐谱中存在的歌唱声音相对应的音频区域的注释。

The manual annotation of the Turkish Makam vocal segment dataset includes annotations of audio regions corresponding to the singing voices present in the musical scores.

创建时间：

2016-12-12

原始信息汇总

数据集概述

数据集名称

Annotations of vocal segments in Turkish Makam on different levels.

数据集注释层级

vocal_sections_anno

类型: 制表符分隔的文件
描述: 对应于乐谱中包含歌唱声音的部分的音频区域。数据从scripts/main.py中的generate_voiced_sections获取，并经过手动检查。

vocal_anno

类型: 制表符分隔的文件
描述: 包含歌唱声音的音频区域，用于歌唱声音检测。计划手动创建。

vocal_onsets_anno

类型: 制表符分隔的文件
描述: 歌唱声音起始时间的标记。通过使用脚本genrate_voiced_aligned_notes自动对齐的起始时间与vocal_anno文件相交获得，并手动调整起始时间。

beats

描述: 节拍的时间戳（通常只注释前60秒）

音频文件获取

命令: python scripts/get_mp3.py a2e650dc-8822-4647-9f4c-c41c0f81b601 data/

搜集汇总

数据集介绍

构建方式

该数据集专注于土耳其马卡姆音乐中的声乐片段标注，构建过程涉及多层次的数据处理与人工校验。首先，通过脚本`generate_voiced_sections`从乐谱中提取含有声乐的音频片段，并经过人工校验以确保准确性。其次，针对声乐检测任务，生成了包含声乐片段的音频区域标注文件。此外，通过自动对齐的声乐起始点与声乐标注文件的交叉验证，生成了声乐起始点的标注数据，并经过人工调整以确保精度。最后，数据集还包含了节拍时间戳的标注，通常仅标注前60秒的节拍信息。

使用方法

该数据集的使用方法灵活多样，适用于多种音乐信息检索任务。用户可以通过脚本`get_mp3.py`从Dunya平台下载音频文件，并结合标注文件进行声乐片段检测、声乐起始点分析等任务。数据集提供了详细的标注文件格式说明，用户可根据需求选择不同层次的标注数据进行研究。例如，`vocal_sections_anno`文件可用于声乐片段的区域分析，而`vocal_onsets_anno`文件则适用于声乐起始点的精确检测。此外，数据集还支持与其他音乐分析工具的集成，为研究者提供了丰富的实验可能性。

背景与挑战

背景概述

土耳其马卡姆声乐片段数据集（Turkish Makam Vocal Segments Dataset）是一个专注于土耳其传统音乐马卡姆（Makam）声乐片段标注的数据集。该数据集由MTG（Music Technology Group）等研究机构创建，旨在为音乐信息检索领域提供高质量的声乐片段标注数据。数据集的核心研究问题包括声乐片段的自动检测、声乐起始点的精确标注以及声乐与背景乐器的分离。通过对土耳其马卡姆音乐的深入研究，该数据集为音乐分析、自动转录和跨文化音乐研究提供了重要的数据支持，推动了音乐信息检索领域的发展。

当前挑战

该数据集在构建过程中面临多重挑战。首先，土耳其马卡姆音乐的复杂性使得声乐片段的自动检测和标注变得极为困难，尤其是在声乐与背景乐器音高重叠的情况下。其次，声乐起始点的精确标注需要结合自动对齐算法与人工校验，以确保标注的准确性，这一过程耗时且易受主观判断影响。此外，数据集中的声乐片段标注需要与乐谱进行对齐，这对音乐信息的跨模态对齐提出了更高的技术要求。这些挑战不仅反映了音乐信息检索领域的复杂性，也为未来的研究提供了重要的改进方向。

常用场景

经典使用场景

在音乐信息检索领域，Turkish Makam Vocal Segments Dataset 被广泛用于研究土耳其马卡姆音乐中的声乐部分。该数据集通过标注声乐片段的时间戳和节拍信息，为研究者提供了精确的声乐区域划分，使得在复杂的音乐结构中识别和分析声乐部分成为可能。这一数据集特别适用于开发自动声乐检测和音乐分割算法，为音乐学研究和计算机音乐分析提供了重要的数据支持。

解决学术问题

Turkish Makam Vocal Segments Dataset 解决了在传统音乐分析中声乐部分难以自动识别的问题。通过提供详细的声乐片段标注，该数据集帮助研究者克服了音乐信号处理中的声乐与乐器分离难题，特别是在多音轨和复杂节奏的音乐中。这不仅提升了声乐检测的准确性，还为音乐风格分析和音乐信息检索系统的开发提供了坚实的基础。

实际应用

在实际应用中，Turkish Makam Vocal Segments Dataset 被用于开发智能音乐编辑工具和音乐推荐系统。通过利用该数据集中的声乐片段信息，音乐编辑软件能够自动识别和提取声乐部分，从而简化音乐制作过程。此外，音乐推荐系统可以利用这些数据为用户提供更加个性化的音乐推荐，增强用户体验。

数据集最近研究