five

POP909

收藏
github2024-04-24 更新2024-05-31 收录
下载链接:
https://github.com/music-x-lab/POP909-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
POP909是一个流行歌曲数据集,用于音乐编排生成。数据集包含多种文件类型,如MIDI音乐文件、节拍和和弦信息文件,以及用于音乐信息检索的不同版本的编排歌曲。

POP909 is a dataset of popular songs designed for music arrangement generation. The dataset encompasses a variety of file types, including MIDI music files, beat and chord information files, as well as different versions of arranged songs for music information retrieval.
创建时间:
2020-07-26
原始信息汇总

POP909 Dataset for Music Arrangement Generation

数据集结构

  • index.xlsx: 包含每个索引文件夹/文件的基本信息列表,如名称、每小节的节拍数、每小节的八分音符数及修改时间。
  • index文件夹: 包含POP909数据集中每个数据的多个文件:
    • index.mid: 音乐MIDI文件,包含主旋律(MELODY轨道)、副旋律(BRIDGE轨道)和伴奏(PIANO轨道)。
    • beat_audio/beat_midi.txt: 从原始音频/MIDI提取的节拍信息,第一列为时间(秒),第二列为节拍顺序。
    • chord_audio/beat_audio.txt: 从原始音频/MIDI提取的和弦信息,第一/二列为开始/结束时间(秒),第三列为和弦名称。
    • key_audio.txt: 从原始音频提取的调性变化信息,第一/二列为开始/结束时间(秒),第三列为调性变化。
    • versions文件夹: 包含同一编曲歌曲的不同版本。

数据处理脚本

  • data_process.ipynb: 用于将POP909 MIDI文件快速处理为Google Magenta音乐表示格式,如Music Transformer和Performance RNN所需的输入令牌。
  • pop-pickle.zip: 包含已转换为Magenta事件令牌表示的pickle文件。

引用信息

若使用此数据集,请引用以下文献:

@inproceedings{pop909-ismir2020, author = {Ziyu Wang* and Ke Chen* and Junyan Jiang and Yiyi Zhang and Maoran Xu and Shuqi Dai and Guxian Bin and Gus Xia}, title = {POP909: A Pop-song Dataset for Music Arrangement Generation}, booktitle = {Proceedings of 21st International Conference on Music Information Retrieval, {ISMIR}}, year = {2020} }

搜集汇总
数据集介绍
main_image_url
构建方式
POP909数据集的构建基于对流行音乐的深入分析与处理,涵盖了909首流行歌曲的详细信息。每首歌曲的数据包括MIDI文件、节拍信息、和弦信息以及调性变化信息,这些信息分别存储在不同的文本文件中。MIDI文件中包含了主旋律、副旋律和伴奏的音轨,而节拍、和弦和调性信息则通过专门的算法从原始音频和MIDI数据中提取。此外,数据集还提供了不同版本的编曲,以丰富数据的多样性。
使用方法
POP909数据集的使用方法灵活多样,用户可以根据需求选择不同的数据处理方式。数据集提供了处理脚本,能够将MIDI文件转换为Google Magenta的音乐表示格式,如Music Transformer和Performance RNN。用户还可以根据需要自定义数据处理文件,以适应不同的模型输入要求。此外,数据集中的pickle文件已经预处理为Magenta的事件标记表示,方便用户快速加载和使用。
背景与挑战
背景概述
POP909数据集是由Ziyu Wang、Ke Chen等研究人员在2020年创建的,旨在为音乐编排生成领域提供一个高质量的流行歌曲数据集。该数据集在ISMIR 2020会议上发表,核心研究问题是如何通过机器学习技术自动生成音乐编排。POP909数据集包含了909首流行歌曲的MIDI文件、节拍信息、和弦信息以及调性变化信息,为音乐生成模型提供了丰富的训练数据。该数据集的发布对音乐信息检索和生成领域具有重要影响,推动了自动音乐编排技术的发展。
当前挑战
POP909数据集在构建过程中面临了多个挑战。首先,从原始音频和MIDI文件中提取准确的节拍、和弦和调性信息是一项复杂的技术任务,需要高效的算法支持。其次,数据集的多样性和代表性也是一个重要挑战,确保涵盖不同风格和结构的流行歌曲,以提高模型的泛化能力。此外,数据集的预处理和格式化也是一个关键问题,如何将MIDI文件转换为适合机器学习模型的输入格式,如Google Magenta的Music Transformer和Performance RNN,需要详细的数据处理脚本和标准化流程。
常用场景
经典使用场景
POP909数据集在音乐编排生成领域展现了其经典应用场景。该数据集通过提供丰富的流行歌曲MIDI文件及其相关信息,如旋律、和弦、节拍等,为研究者提供了一个全面的音乐数据平台。研究者可以利用这些数据进行音乐生成模型的训练,特别是在旋律生成、和弦进行预测以及伴奏生成等方面,POP909数据集为这些任务提供了详尽的输入数据和标签,极大地促进了音乐生成技术的发展。
解决学术问题
POP909数据集在解决音乐信息检索和音乐生成领域的多个学术问题上具有重要意义。首先,它为研究者提供了一个标准化的流行歌曲数据集,解决了音乐数据集稀缺和不统一的问题。其次,通过提供详细的音乐元素信息,如旋律、和弦和节拍,该数据集有助于研究者深入探索音乐生成的复杂性,推动了音乐生成模型在旋律连续性、和弦转换自然性等方面的研究进展。
实际应用
在实际应用中,POP909数据集为音乐创作和教育领域提供了强大的支持。音乐制作人可以利用该数据集训练的模型自动生成旋律和伴奏,从而加速音乐创作过程。同时,教育机构可以利用这些数据进行音乐理论和创作的教学,帮助学生更好地理解音乐结构和创作技巧。此外,该数据集还为音乐推荐系统提供了丰富的素材,通过分析用户的音乐偏好,系统可以生成个性化的音乐推荐。
数据集最近研究
最新研究方向
在音乐信息检索与生成领域,POP909数据集的最新研究方向主要集中在音乐编排生成与自动化的前沿探索。该数据集通过提供丰富的流行歌曲MIDI文件及其相关音乐元素的详细信息,如旋律、和弦、节拍等,为研究者们提供了强大的数据支持。当前的研究热点包括利用深度学习模型,如Music Transformer和Performance RNN,对音乐进行自动编排和生成,以实现更高质量的音乐创作。此外,POP909数据集的多样性和详细标注也推动了音乐风格迁移、情感分析等跨领域研究的发展,进一步拓宽了音乐信息处理的应用边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作