m-a-p/Music-Instruct
收藏Music Instruct (MI) 数据集
概述
Music Instruct (MI) 数据集用于训练和评估 MusiLingo 模型。该数据集包含与音乐作品相关的问答对,特别针对开放式音乐查询。数据集源自 MusicCaps 数据集中的音乐-标题对。MI 数据集通过提示工程和应用少量学习技术从 GPT-4 生成。
数据集版本
- v1 (短问题):包含 27,540 个问答对,寻求关于音乐片段的详细信息,如情感、乐器、声轨、节奏和流派等,通常产生简短的一到两句话回答。
- v2 (长问题):包含 32,953 个问答对,涉及更一般的音乐作品问题,通常产生更广泛的回答,作为原始标题的改写版本。
评估和数据集划分
数据集可以分为训练集和测试集:
- 训练集:使用 AudioSet 训练分割中的音频的所有(或长/短部分)问答对作为 MI 训练集。
- 测试集:使用 AudioSet 评估分割中的音频的短问答和长问答分别作为两个测试集。
训练集示例
python ds_mixed_train = MIDataset(processor, /content/drive/MyDrive/music_data, split=train, question_type=all) ds_long_train = MIDataset(processor, /content/drive/MyDrive/music_data, split=train, question_type=long) ds_short_train = MIDataset(processor, /content/drive/MyDrive/music_data, split=train, question_type=short)
测试集示例
python ds_short = MIDataset(processor, /content/drive/MyDrive/music_data, split=test, question_type=short) ds_long = MIDataset(processor, /content/drive/MyDrive/music_data, split=test, question_type=long)
评估指标
评估包括 BLEU、METEOR、ROUGE 和 Bert-Score。
引用
plaintext @article{deng2023musilingo, title={MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response}, author={Deng, Zihao and Ma, Yinghao and Liu, Yudong and Guo, Rongchen and Zhang, Ge and Chen, Wenhu and Huang, Wenhao and Benetos, Emmanouil}, journal={arXiv preprint arXiv:2309.08730}, year={2023} }




