five

ZheqiDAI/MusicScore

收藏
Hugging Face2024-06-20 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/ZheqiDAI/MusicScore
下载链接
链接失效反馈
官方服务:
资源简介:
MusicScore是一个大规模的音乐乐谱数据集,收集并处理自国际音乐乐谱图书馆项目(IMSLP)。该数据集由图像-文本对组成,其中图像是乐谱页面,文本是音乐的元数据。元数据包括作曲家、乐器、曲目风格和流派等丰富信息。数据集分为三个子集:MusicScore-400、MusicScore-14k和MusicScore-200k,分别包含403、14656和204800个图像-文本对。MusicScore-400子集包含19首最受欢迎的钢琴和小提琴作品,而MusicScore-14k和MusicScore-200k子集则通过颜色深度和内容进行了筛选。

MusicScore is a large-scale musical score dataset collected and curated from the International Music Score Library Project (IMSLP). This dataset consists of image-text pairs, where the images are music score pages and the texts are music metadata. The metadata includes rich information such as composer, instrument, piece style and genre. The dataset is divided into three subsets: MusicScore-400, MusicScore-14k and MusicScore-200k, which contain 403, 14656 and 204800 image-text pairs respectively. The MusicScore-400 subset includes 19 of the most popular piano and violin works, while the MusicScore-14k and MusicScore-200k subsets are filtered based on color depth and content.
提供机构:
ZheqiDAI
原始信息汇总

MusicScore: A Dataset for Music Score Modeling and Generation

数据集概述

MusicScore是一个大规模的音乐乐谱数据集,从国际乐谱图书馆项目(IMSLP)收集和处理而来。该数据集包含图像-文本对,其中图像是一页乐谱,文本是音乐的元数据。元数据包括作曲家、乐器、乐曲风格和音乐流派等丰富信息。

数据集规模

MusicScore数据集被分为三个不同规模的子集:

子集 图像数量
MusicScore-400 403
MusicScore-14k 14656
MusicScore-200k 204800

子集详情

  • MusicScore-400:包含19首最受欢迎的钢琴和小提琴作品。
  • MusicScore-14k 和 -200k:通过颜色深度和内容覆盖进行图像过滤。对于后者,基于ResNet18训练了一个分类模型。

示例

一个示例样本(IMSLP913207_11.jpg来自MusicScore-400),包含图像及其匹配的元数据存储在一个JSON文件中。

json { "Work Title": "Violin Concerto", "Alternative. Title": "Violin Concerto [No.2]", "Name Translations": "Koncert skrzypcowy; Husľový koncert; Концерт для скрипки с оркестром; 바이올린 협주곡; concerto pour violon en mi mineur; Violin Concerto in E minor; Concierto para violín; Concertul pentru vioară; ไวโอลินคอนแชร์โต; Concert per a violí; Viulukonsertto; Концерт для скрипки з оркестром; Concerto per violino e orchestra op. 64; Violinkonzert e-Moll; ヴァイオリン協奏曲; Violinski koncert; Vioolconcert; کنسرتو ویلن در می مینور (مندلسون); 小提琴协奏曲; Violin Concerto (Mendelssohn); 小提琴協奏曲孟德爾頌; Violinkonsert; Houslový koncert e moll; Concerto para violino; Violinkoncert i e-mol; קונצרטו לכינור במי מינור; Kunċert għal vjolin u orkestra fil-Mi minuri, op. 64; Koncertas smuikui (Mendelsonas); Konserto Biola dalam E Minor; Violonkonĉerto en E-minoro", "Name Aliases": "멘델스존 바이올린 협주곡; 멘델스존 바이올린협주곡; Concierto para violin; Concierto para violín nº 2; Concierto para violín n.º 2; Concierto para violin n 2; Concierto para violin nº 2; Concierto para violin n.º 2; Concierto para violin nº2 de Mendelssohn; Concierto para violín n 2; Concierto para violin n 2 de Mendelssohn; Concierto para violín n 2 de Mendelssohn; Concierto para violin n. 2; Concierto para violín n. 2; Concierto para violín nº2 de Mendelssohn; ไวโอลินคอนแชร์โต ในบันไดเสียง อี ไมเนอร์; Concert per a violí de Mendelssohn; Mendelssohnin viulukonsertto; Violinkonzert; Violinkonzert e-Moll op. 64; メンコン; メン・コン; Violinski koncert- Mendelssohn; Vioolconcert in e-klein; Vioolconcert (Mendelssohn-Bartholdy); concerto n° 2 pour violon et orchestre en mi mineur; concerto pour violon n° 2 de Mendelssohn; concerto n° 2 pour violon et orchestre; concerto n° 2 pour violon; concerto pour violon n° 2; concerto pour violon et orchestre n° 2 de Mendelssohn; Violin Concerto in E Minor, Op. 64; קונצרטו לכינור במי מינור, אופוס 64; Konserto Biola dalam E Minor, Op. 64", "Authorities": "WorldCat; Wikipedia; LCCN: n91030067; GND: 300101902", "Composer": "Mendelssohn, Felix", "Opus/Catalogue NumberOp./Cat. No.": "Op.64 ; MWV O 14", "I-Catalogue NumberI-Cat. No.": "IFM 196", "Key": "E minor", "Movements/SectionsMovts/Secs": "3 movements: Allegro molto appassionato (528 bars) Andante - Allegretto non troppo (123 bars) Allegro molto vivace (234 bars)", "Year/Date of CompositionY/D of Comp.": "1838-1844 (Sept. 16), rev.1845", "First Performance.": "1845-03-13 in Leipzig, Saal des Gewandhauses Ferdinand David (violin), Gewandhaus orchestra, Niels Gade (conductor)", "First Publication.": "1845 – Leipzig: Breitkopf und Härtel // London: J. J. Ewer & Co. // Milan: J. Ricordi (Hofmeisters Monatsbericht (1845), p.98)", "Dedication": "Ferdinand David", "Average DurationAvg. Duration": "30 minutes", "Composer Time PeriodComp. Period": "Romantic", "Piece Style": "Romantic", "Instrumentation": "violin, orchestra", "InstrDetail": "18 parts 2 flutes, 2 oboes, 2 clarinets, 2 bassoons2 horns, 2 trumpets, timpani, strings", "Related Works": "Grande Allegro di Concerto by BottesiniAnalytical studies for Mendelssohns Violin Concerto by Ševčík", "Discography": "MusicBrainz", "External Links": "Wikipedia articleAll Music Guide", "id": "IMSLP913207" }

搜集汇总
数据集介绍
main_image_url
构建方式
在数字音乐研究领域,构建高质量的数据集是推动乐谱建模与生成技术发展的基石。MusicScore数据集源自国际乐谱图书馆项目(IMSLP),通过系统化的数据采集与处理流程构建而成。研究团队从IMSLP页面中提取了包含作曲家、乐器、曲风与流派等丰富元数据的文本信息,并与对应的乐谱页面图像配对,形成了图像-文本对结构。数据集依据多样性标准被精心划分为三个规模层级,分别包含400、14k与200k个样本,其中较大规模子集通过基于ResNet18的分类模型进行了色彩深度与内容覆盖的筛选,确保了数据的质量与适用性。
特点
MusicScore数据集在音乐信息检索与生成任务中展现出显著特性。其核心在于提供了大规模、结构化的乐谱图像与详尽元数据的配对,元数据涵盖了从作曲家、作品标题到演奏乐器、调性、曲风乃至首次演出日期等多维度信息,为深度理解音乐语义提供了丰富上下文。数据集的三个子集设计兼顾了研究的灵活性与可扩展性,其中MusicScore-400聚焦于19部经典钢琴与小提琴作品,便于初步验证;而更大规模的子集则通过自动化过滤增强了数据的多样性与代表性,支持复杂模型的训练与评估。
使用方法
针对音乐生成与建模的研究应用,MusicScore数据集提供了清晰的使用路径。用户可通过加载元数据JSON文件,依据乐谱图像ID匹配对应的文本描述,构建自定义的数据加载类。示例代码展示了如何从元数据中提取作曲家、乐器编制、曲风等关键字段,并组合成结构化文本提示,作为生成模型的输入条件。数据集支持直接用于训练视觉-语言模型或乐谱生成系统,其分层的子集结构允许研究者根据计算资源与任务复杂度灵活选择数据规模,并通过公开的代码库获取数据处理与评估脚本,确保实验的可复现性。
背景与挑战
背景概述
在音乐信息检索与计算音乐学领域,乐谱数据的数字化与结构化一直是推动智能音乐生成与分析的关键基础。MusicScore数据集于2024年由Yuheng Lin、Zheqi Dai和Qiuqiang Kong等研究人员构建,其核心研究问题聚焦于乐谱建模与生成任务。该数据集从国际乐谱图书馆项目中系统采集并处理,形成了包含图像与丰富元数据配对的大规模资源。通过提供作曲家、乐器、曲风及调性等多维度标注信息,MusicScore为深度学习模型在乐谱理解、跨模态生成及音乐风格迁移等前沿方向提供了重要实验基础,显著促进了音乐人工智能领域的数据驱动研究进展。
当前挑战
MusicScore数据集致力于解决乐谱图像到结构化音乐信息的跨模态建模挑战,其核心在于如何实现乐谱视觉内容与高层语义属性的精确对齐。在构建过程中,研究人员面临数据清洗与质量控制的难题,例如需从海量原始扫描图像中筛选色彩深度合格且内容完整的乐谱页面,并设计分类模型以自动化过滤低质量样本。同时,元数据提取与标准化亦构成关键障碍,需从异构文本描述中精准解析作曲家、乐器编制等字段,并处理多语言别名及历史记谱差异带来的语义歧义,这些因素共同增加了数据集构建的复杂性与技术门槛。
常用场景
经典使用场景
在音乐信息检索与计算音乐学领域,MusicScore数据集以其大规模乐谱图像与丰富元数据的配对结构,为乐谱建模与生成任务提供了关键资源。该数据集最经典的应用场景在于训练多模态深度学习模型,例如结合视觉编码器与文本解码器的架构,实现从乐谱图像到结构化音乐信息的自动解析,或基于文本描述生成对应的乐谱视觉表示。这类研究通常聚焦于探索乐谱的视觉特征与音乐语义之间的深层关联,为自动化音乐分析奠定基础。
解决学术问题
MusicScore数据集有效应对了音乐计算研究中乐谱数据稀缺且标注不一致的长期挑战。它通过系统化整合IMSLP的乐谱资源,并提取作曲家、乐器、曲式风格等结构化元数据,为研究者提供了标准化的基准数据。该数据集支持解决乐谱光学音乐识别中的泛化性问题、跨模态音乐表征学习,以及音乐风格迁移等核心学术议题,显著推动了音乐人工智能领域从数据驱动到知识融合的范式演进。
衍生相关工作
围绕MusicScore数据集,已衍生出一系列探索乐谱多模态理解的经典工作。这些研究通常借鉴计算机视觉与自然语言处理的前沿方法,如基于Transformer的架构进行乐谱图像生成,或利用对比学习对齐乐谱视觉与文本描述。相关成果不仅深化了对音乐符号视觉表征的理解,也为跨模态生成模型在艺术领域的应用提供了可复现的范例,持续激发着音乐与人工智能交叉学科的创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作