XMIDI Dataset

github2025-01-16 更新2025-01-17 收录

下载链接：

https://github.com/xmusic-project/XMIDI_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

我们构建了XMIDI，这是一个已知最大的带有精确情感和流派标签的符号音乐数据集，包含108,023个MIDI文件。音乐片段的平均时长约为176秒，整个数据集的总时长约为5,278小时。

We developed XMIDI, the largest known symbolic music dataset with precise emotion and genre labels, which comprises 108,023 MIDI files. The average duration of each musical track in the dataset is approximately 176 seconds, and the total cumulative runtime of the entire dataset amounts to roughly 5,278 hours.

创建时间：

2025-01-16

原始信息汇总

XMIDI 数据集概述

数据集简介

XMIDI 是一个大规模符号音乐数据集，包含精确的情感和流派标签。该数据集由 108,023 个 MIDI 文件组成，平均每首音乐的时长为 176 秒，总时长约为 5,278 小时。

数据集内容

文件数量: 108,023 个 MIDI 文件
文件命名格式: XMIDI_<Emotion>_<Genre>_<ID_len_8>.midi
- <Emotion>: 情感标签
- <Genre>: 流派标签
- <ID_len_8>: 8 位长度的唯一标识符

下载方式

数据集可通过 Google Drive 下载。

引用

如果 XMIDI 数据集对您的研究有帮助，请引用以下论文：

bibtex @article{xmusic2025, title={XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework}, author={Tian, Sida and Zhang, Can and Yuan, Wei and Tan, Wei and Zhu, Wenjie}, journal={IEEE Transactions on Multimedia}, year={2025}, publisher={IEEE} }

搜集汇总

数据集介绍

构建方式

XMIDI数据集的构建基于大规模的音乐数据收集与标注过程，涵盖了108,023个MIDI文件。每个文件均经过精确的情感与流派标注，确保了数据的高质量与多样性。数据集的构建过程中，采用了自动化与人工审核相结合的方式，确保了标注的准确性与一致性。平均每首音乐的时长为176秒，总时长达到5,278小时，为音乐生成与分析提供了丰富的素材。

特点

XMIDI数据集以其大规模与精确标注著称，涵盖了广泛的情感与音乐流派类别。每个MIDI文件均以标准化的命名格式存储，便于用户快速检索与分类。数据集不仅适用于音乐生成任务，还可用于情感分析与音乐风格研究。其多样化的音乐内容与高质量的标注，使其成为音乐信息检索与机器学习领域的宝贵资源。

使用方法

XMIDI数据集的使用方法简便直观，用户可通过Google Drive下载包含所有MIDI文件的压缩包。每个文件的命名格式为`XMIDI_<Emotion>_<Genre>_<ID_len_8>.midi`，便于用户根据情感与流派进行筛选与分析。数据集适用于多种音乐相关的研究任务，如音乐生成、情感分类与风格迁移等。用户可通过引用相关论文，确保研究工作的学术规范性与可追溯性。

背景与挑战

背景概述

XMIDI数据集是由Sida Tian、Can Zhang、Wei Yuan等研究人员于2025年发布的一个大规模符号音乐数据集，旨在推动符号音乐生成领域的研究。该数据集包含108,023个MIDI文件，每个文件均带有精确的情感和流派标签，平均时长为176秒，总时长达到5,278小时。XMIDI的创建标志着符号音乐生成领域的一个重要里程碑，为研究人员提供了一个丰富且多样化的音乐数据资源，支持情感和流派控制的音乐生成任务。该数据集的研究背景源于对音乐生成模型的泛化能力和可控性的需求，特别是在情感和流派表达方面的精确控制。XMIDI的发布不仅为音乐生成算法提供了高质量的基准数据，还推动了音乐信息检索、情感计算等相关领域的发展。

当前挑战

XMIDI数据集在构建和应用过程中面临多重挑战。首先，符号音乐生成领域的一个核心挑战是如何在生成过程中精确控制音乐的情感和流派特征，这要求数据集具备高质量且多样化的标签信息。XMIDI通过提供精确的情感和流派标签部分解决了这一问题，但如何确保标签的准确性和一致性仍是一个技术难点。其次，数据集的构建过程中，研究人员需要处理大量异构的MIDI文件，确保其格式统一且数据质量可靠，这对数据处理和清洗提出了较高要求。此外，如何在大规模数据集上训练高效且可控的音乐生成模型，同时保持生成音乐的多样性和艺术性，也是当前研究中的一个重要挑战。

常用场景

经典使用场景

XMIDI数据集作为一个大规模符号音乐数据集，广泛应用于音乐情感分析和风格分类研究。其精确的情感与流派标签为研究者提供了丰富的标注信息，使得在音乐生成、情感识别及流派分类等任务中，能够进行更为细致的模型训练与验证。该数据集尤其适用于基于深度学习的音乐生成模型，如生成对抗网络（GAN）和变分自编码器（VAE），以生成具有特定情感或风格的音乐作品。

衍生相关工作

XMIDI数据集的发布催生了一系列相关研究，特别是在音乐生成与情感分析领域。例如，基于XMIDI的XMusic框架提出了一个通用的可控音乐生成模型，能够根据用户指定的情感或风格生成音乐。此外，许多研究利用XMIDI数据集开发了新的音乐情感分类算法，进一步推动了音乐信息检索技术的发展。这些工作不仅验证了XMIDI数据集的价值，也为未来的音乐生成与分析研究提供了重要参考。

数据集最近研究