five

OpenScore Lieder

收藏
github2024-02-02 更新2024-05-31 收录
下载链接:
https://github.com/OpenScore/Lieder
下载链接
链接失效反馈
官方服务:
资源简介:
包含19世纪作曲家的歌曲集合,以MuseScore格式存储,并附带相关数据。数据集提供了多种格式的下载选项,并详细说明了如何转换和使用这些数据。

This dataset comprises a collection of songs by 19th-century composers, stored in MuseScore format along with associated data. It offers various download options and provides detailed instructions on how to convert and utilize the data.
创建时间:
2021-01-26
原始信息汇总

数据集概述

数据集名称

OpenScore Lieder

数据集描述

OpenScore Lieder是一个收集了19世纪作曲家的歌曲的数据集,这些歌曲以MuseScore格式存储,并附带相关数据。

数据格式

  • 原始格式: MuseScore格式(.mscx)
  • 可转换格式: PDF, MIDI, MusicXML, MP3等

数据获取方式

用户可以从官方页面[OpenScore Lieder]下载单个乐谱,或使用MuseScore的桌面软件批量转换格式。

数据组织结构

  • 目录结构: <composer>/<set>/<song>
    • <composer>: 作曲家名称
    • <set>: 作品集名称
    • <song>: 歌曲名称
  • 文件命名规则: lc<id>.mscxlc<id>.txt
    • lc: Lieder Corpus
    • <id>: 乐谱的唯一Musescore ID
    • .mscx: MuseScore的未压缩乐谱格式
    • .txt: 歌词文件格式

附加信息

  • 自动和声分析: 提供每个乐谱的自动和声分析文件,格式为analysis_automatic.rntxt
  • 歌词文件: 歌词文件与乐谱文件同名,扩展名为.txt,用于辅助文本研究和交叉引用。
  • 数据目录: 包含关于作曲家、乐谱和作品集的详细信息,以及用于批量转换的脚本和配置文件。

许可证

数据集根据Creative Commons Zero (CC0)许可证发布。

引用信息

  • Gotham, M. R. H.; and Jonas, P. The OpenScore Lieder Corpus. In Münnich, S.; and Rizo, D., editor(s), Music Encoding Conference Proceedings 2021, pages 131–136, 2022. Humanities Commons. Best Poster Award. https://doi.org/10.17613/1my2-dm23
搜集汇总
数据集介绍
main_image_url
构建方式
OpenScore Lieder数据集的构建依托于MuseScore平台,收录了19世纪作曲家的歌曲作品,并以MuseScore格式存储。数据集通过志愿者和专业校对团队的共同努力,将乐谱转录为数字格式,并附带了丰富的元数据。乐谱文件以MuseScore的未压缩格式(.mscx)保存,同时提供了歌词文件(.txt)和自动生成的和声分析文件(.rntxt)。此外,数据集还包含了用于批量转换的脚本和配置文件,支持将乐谱转换为PDF、MIDI、MusicXML等多种格式。
特点
OpenScore Lieder数据集以其高质量的数字乐谱和丰富的元数据著称,涵盖了100多位作曲家的1200多首歌曲,展现了19世纪艺术歌曲的多样性。数据集不仅提供了乐谱文件,还包含了歌词、和声分析等辅助信息,为音乐信息检索(MIR)研究提供了全面的数据支持。此外,数据集的结构化目录设计和批量转换功能,使得研究人员能够高效地处理和分析大规模乐谱数据。
使用方法
使用OpenScore Lieder数据集时,用户可以通过MuseScore平台或GitHub仓库下载乐谱文件,支持多种格式的转换。数据集提供了批量转换脚本(corpus_conversion.py)和配置文件(corpus_conversion.json),用户可通过命令行工具实现乐谱格式的批量转换。此外,数据集的结构化目录设计便于用户按作曲家、作品集和歌曲进行检索和分析。对于学术研究,建议引用相关文献,并在公开使用数据集时注明来源和链接。
背景与挑战
背景概述
OpenScore Lieder数据集是一个专注于19世纪作曲家歌曲的数字化资源,由MuseScore平台提供支持。该数据集由Mark Gotham和Peter Jonas等研究人员主导,旨在为音乐信息检索(MIR)研究提供高质量的乐谱数据。数据集包含超过1200首歌曲,涵盖了100多位作曲家的作品,涉及多种语言和风格。自2018年项目启动以来,OpenScore Lieder通过志愿者和专业团队的共同努力,逐步构建了一个结构化的、带有丰富元数据的乐谱库。该数据集在2021年正式发布,并在音乐编码会议(MEC)上获得了最佳海报奖,成为MIR领域的重要资源之一。
当前挑战
OpenScore Lieder数据集在构建过程中面临了多方面的挑战。首先,乐谱的数字化和编码需要高度的精确性,尤其是在处理复杂的音乐符号和多声部作品时,确保数据的准确性和一致性成为主要难题。其次,数据集涵盖了多种语言和风格的歌曲,如何有效地提取和组织歌词信息,尤其是面对多声部歌曲和变奏部分时,增加了数据处理的复杂性。此外,自动化的和声分析虽然提供了额外的研究价值,但其结果的可靠性和标准化仍需进一步验证。最后,数据集的大规模发布和持续更新要求高效的批量转换工具和文件管理系统,以确保数据的可用性和兼容性。
常用场景
经典使用场景
OpenScore Lieder数据集在音乐信息检索(MIR)领域具有广泛的应用,尤其是在19世纪艺术歌曲的分析与研究中。该数据集收录了超过1,200首由19世纪作曲家创作的歌曲,涵盖了多种语言和风格,为研究者提供了丰富的音乐素材。通过MuseScore格式的乐谱文件,研究者可以轻松进行乐谱分析、和声分析以及歌词与音乐的关联研究。此外,数据集还提供了MIDI、MusicXML等多种格式的转换,便于在不同研究工具中使用。
实际应用
在实际应用中,OpenScore Lieder数据集为音乐教育、音乐创作和音乐技术开发提供了重要支持。音乐教育者可以利用该数据集中的乐谱进行教学,帮助学生理解19世纪艺术歌曲的创作技巧与风格特征。作曲家则可以通过分析这些经典作品,汲取灵感并应用于现代音乐创作。此外,音乐技术开发者可以利用数据集中的MIDI和MusicXML文件,开发自动作曲、音乐生成和智能伴奏系统,推动音乐技术的创新与发展。
衍生相关工作
OpenScore Lieder数据集衍生了许多经典的研究工作,尤其是在音乐信息检索和计算音乐学领域。例如,研究者利用该数据集开发了自动和声分析工具,进一步推动了音乐理论研究的自动化进程。此外,数据集还被用于音乐风格分类、作曲家识别和歌词与音乐关联分析等任务,为相关领域的研究提供了重要的数据支持。一些研究还基于该数据集探讨了19世纪艺术歌曲的文化背景与历史意义,丰富了音乐学研究的视角与方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作