midi-audio-abc_10s
收藏数据集概述
基本信息
- 数据集名称:midi-audio-abc_10s
- 许可证:apache-2.0
- 标签:music, art
数据内容
数据集包含MIDI文件、合成音频和ABC代码三元组,专门筛选音频时长在5-10秒之间的样本,这些样本是从最大时长为300秒的完整数据集中采样得到。
数据特征
- id:字符串类型,标识符
- mid:字符串类型
- midi_file:结构体,包含字节序列(uint8)、文件名(字符串)和大小(int64)
- audio:音频类型
- audio_duration:浮点型,音频时长
- abc:字符串类型,ABC记谱法代码
- token_length_abc:整型,表示ABC文本相对于Qwen3分词器的标记数量
数据规模
- 训练集分割:包含18,893个样本
- 数据集大小:约1.70 GB
- 下载大小:约1.52 GB
数据来源与处理
- MIDI文件来源:https://huggingface.co/datasets/breadlicker45/bread-midi-dataset
- 合成音频:使用Don Allen的"Timbres of Heaven"作为音色库,通过FluidSynth合成器生成
- ABC记谱法生成:通过EasyABC的mid2abc工具(midi2abc.py)从MIDI转换而来
引用信息
bibtex @misc{jiang2025advancingfoundationmodelmusic, title={Advancing the Foundation Model for Music Understanding}, author={Yi Jiang and Wei Wang and Xianwen Guo and Huiyun Liu and Hanrui Wang and Youri Xu and Haoqi Gu and Zhongqian Xie and Chuanjiang Luo}, year={2025}, eprint={2508.01178}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01178}, }
@misc {matthew_mitton_2025, author = { {Matthew Mitton} }, title = { bread-midi-dataset (Revision 95c2155) }, year = 2025, url = {https://huggingface.co/datasets/breadlicker45/bread-midi-dataset}, doi = { 10.57967/hf/4748 }, publisher = { Hugging Face } }




