five

ChoCo

收藏
github2024-03-28 更新2024-05-31 收录
下载链接:
https://github.com/smashub/choco
下载链接
链接失效反馈
官方服务:
资源简介:
ChoCo提供超过2万个时间同步的和弦标注,这些标注来自多个存储库和数据库,涵盖多种音乐风格和类型。数据集以JAMS格式和知识图谱形式发布,支持音频和乐谱的和弦标注,使用Harte和罗马数字两种和弦表示法。

ChoCo offers over 20,000 time-synchronized chord annotations sourced from multiple repositories and databases, encompassing a wide range of musical styles and genres. The dataset is published in JAMS format and as a knowledge graph, supporting chord annotations for both audio and sheet music, utilizing both Harte and Roman numeral chord notations.
创建时间:
2022-02-23
原始信息汇总

ChoCo: 和弦语料库概述

ChoCo(和弦语料库)提供了超过20,000个时间同步的和弦注释,这些注释来自多个存储库和数据库,涵盖了多种风格和流派。ChoCo的和弦注释以两种格式发布:

  1. JAMS格式:区分音频和乐谱注释,时间/韵律信息以秒(音频)和节拍(乐谱)表示。
  2. 知识图谱:基于JAMS本体和和弦、罗马数字本体,通过SPARQL端点提供查询。

和弦表示

ChoCo中的和弦被转换为以下两种符号家族:

  • Harte符号:广泛用于音乐信息检索系统,基于领图表的符号。
  • 罗马数字符号:根据和弦的度数命名,是一种广泛认可的标准。

注释内容

ChoCo的注释包含丰富的来源数据,包括注释作品或轨道的元数据、注释作者、标识符和链接等。当前版本的ChoCo仅包含由人类注释者(如音乐专家、学生)或经过验证的众包注释的高质量时间同步和弦注释。

使用方法

使用JAMS文件

如果使用Python,只需确保系统中安装了jams库。通过下载ChoCo的发布版本,可以使用jams库读取、操作和编辑和弦注释。

使用RDF文件

另一种方法是使用ChoCo的知识图谱和发布文件夹中的RDF文件,或直接查询SPARQL端点。

数据集统计

ChoCo当前版本包含20,080个JAMS文件,其中2,283个来自音频分区,17,803个来自符号音乐。这些文件提供了60,263个不同的注释,包括20,530个Harte符号的和弦注释和20,029个音调和调制注释。

注释来源

ChoCo的注释来自多个来源,包括但不限于Isophonics、JAAH、Schubert-Winterreise等,涵盖了流行、摇滚、爵士和古典等多种音乐风格。

安装与贡献

ChoCo可以通过本地安装或Docker安装使用。贡献者可以通过遵循ChoCo的转换工作流程提交注释/数据集。版本控制遵循X.Y.Z约定,其中X表示新数据/集合的可用性。

作者与致谢

ChoCo由Jacopo de Berardinis、Andrea Poltronieri、Albert Meroño-Peñuela和Valentina Presutti等人开发,并得到了Polifonia项目的支持。数据和代码根据CC BY 4.0或CC BY-NC-SA 4.0许可发布。

搜集汇总
数据集介绍
main_image_url
构建方式
ChoCo数据集的构建过程融合了多个来源的数据,通过标准化和语义增强的方式,整合了超过20,000个带时间戳的和弦注释。这些注释涵盖了多种风格和流派,并被转换为两种主要格式:JAMS数据集和知识图谱。在构建过程中,和弦注释被统一转换为Harte和罗马数字两种表示法,以确保注释的一致性和互操作性。此外,ChoCo还包含了丰富的来源数据,包括被注释作品或音轨的元数据、注释作者、标识符和链接等。
特点
ChoCo数据集的特点在于其多样性和高质量。它包含了来自不同来源和格式的和弦注释,涵盖了从流行音乐到古典音乐的广泛流派。所有注释均由人类专家或经过验证的众包注释者提供,确保了数据的高质量。此外,ChoCo提供了丰富的工具和数据转换管道,支持新的和弦数据集的集成,增强了数据集的可扩展性和实用性。
使用方法
ChoCo数据集的使用方法灵活多样。用户可以选择使用JAMS文件格式,通过Python的`jams`库进行读取、操作和编辑。此外,用户还可以通过RDF文件或直接查询SPARQL端点来访问知识图谱中的和弦注释数据。对于希望定制数据集的用户,ChoCo还提供了Docker镜像,支持自定义数据集的创建。通过这些方法,用户可以充分利用ChoCo数据集进行音乐信息检索和分析研究。
背景与挑战
背景概述
ChoCo(Chord Corpus)是一个由多个数据源整合、标准化和语义增强的和弦注释数据集,涵盖了20,000多个带时间的和弦注释,涉及多种音乐风格和流派。该数据集由Polifonia项目的主要研究人员和机构创建,旨在解决音乐信息检索系统中的和弦注释一致性和互操作性问题。ChoCo不仅提供了丰富的和弦注释,还通过JAMS和知识图谱两种格式发布,以支持不同研究需求。其核心研究问题包括和弦表示的标准化、注释的语义描述以及数据集的多样性,对音乐分析和信息检索领域具有重要影响。
当前挑战
ChoCo数据集在构建过程中面临多个挑战。首先,不同数据源的和弦注释格式和表示方法的多样性,要求进行复杂的标准化处理,以确保数据的一致性和互操作性。其次,和弦注释的语义描述需要精确且符合音乐理论,这增加了数据处理的复杂性。此外,数据集的多样性和注释质量的保证,特别是仅包含由人类专家或经过验证的众包注释,也是一大挑战。这些挑战不仅涉及技术层面的数据处理和转换,还包括对音乐理论的深入理解和应用。
常用场景
经典使用场景
ChoCo数据集的经典使用场景主要集中在音乐信息检索(MIR)领域,特别是在和声分析和音乐风格识别方面。研究者可以利用ChoCo中的丰富和声标注,进行音乐作品的自动和声分析、和弦识别以及音乐情感分析等任务。此外,ChoCo还支持跨模态的音乐分析,如结合音频和乐谱数据进行更精确的音乐理解。
实际应用
在实际应用中,ChoCo数据集被广泛用于音乐教育和音乐创作辅助工具的开发。例如,音乐教师可以利用ChoCo中的和声数据来设计更有效的教学材料,而音乐制作人则可以借助ChoCo的和声分析功能来创作和编排音乐作品。此外,ChoCo还支持音乐推荐系统的发展,通过分析用户的音乐偏好来提供个性化的音乐推荐。
衍生相关工作
ChoCo数据集的发布催生了一系列相关研究工作,特别是在音乐知识图谱和音乐信息检索领域。例如,基于ChoCo的和声数据,研究者开发了新的和声分析算法和音乐风格分类模型。此外,ChoCo还启发了对音乐数据标准化和互操作性的进一步研究,推动了音乐信息检索技术的整体进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作