midi-audio-abc_30s
收藏数据集概述
基本信息
- 数据集名称: midi-audio-abc_30s
- 来源: 从完整数据集[midi-audio-abc_300s](https://huggingface.co/datasets/Yi3852/midi- audio-abc_300s)中采样得到
- 数据量: 74,909个样本
- 总大小: 16,085,858,261.536字节
- 下载大小: 13,529,342,431字节
数据内容
该数据集包含MIDI文件、合成音频和ABC代码三元组,所有音频时长均在5-30秒范围内。
数据结构
数据集包含以下字段:
id: 字符串类型,样本标识符mid: 字符串类型midi_file: 结构体类型,包含:bytes: 字节序列(uint8)filename: 字符串类型,文件名size: int64类型,文件大小
audio: 音频数据类型audio_duration: float64类型,音频时长abc: 字符串类型,ABC记谱法代码token_length_abc: int64类型,基于Qwen3分词器的ABC文本标记数量
数据来源与处理
- MIDI文件: 来源于bread-midi-dataset
- 合成音频: 使用Don Allen的Timbres of Heaven作为音色库,通过FluidSynth合成器生成
- ABC记谱法: 通过EasyABC的midi2abc.py工具从MIDI转换得到
引用信息
bibtex @misc{jiang2025advancingfoundationmodelmusic, title={Advancing the Foundation Model for Music Understanding}, author={Yi Jiang and Wei Wang and Xianwen Guo and Huiyun Liu and Hanrui Wang and Youri Xu and Haoqi Gu and Zhongqian Xie and Chuanjiang Luo}, year={2025}, eprint={2508.01178}, archivePrefix={arXiv}, primaryClass={cs.SD}, url={https://arxiv.org/abs/2508.01178}, }
@misc {matthew_mitton_2025, author = { {Matthew Mitton} }, title = { bread-midi-dataset (Revision 95c2155) }, year = 2025, url = {url{https://huggingface.co/datasets/breadlicker45/bread-midi-dataset }}, doi = { 10.57967/hf/4748 }, publisher = { Hugging Face } }




