five

Jazz Chord Progressions Corpus

收藏
github2023-10-20 更新2024-05-31 收录
下载链接:
https://github.com/carey-bunks/Jazz-Chord-Progressions-Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含类似于爵士假书中的符号化和弦进行,主要来自爵士标准曲目,也包括蓝调、爵士蓝调、模态爵士、传统歌曲和流行曲目。目前,数据集包含2,612首歌曲,共134,182个和弦,其中有1,542个独特符号。这是维护者所知最大的数字爵士和弦进行集合,希望对音乐信息检索、音乐信息学和音乐学领域的研究有所帮助。

This dataset encompasses symbolic chord progressions akin to those found in jazz fake books, primarily derived from jazz standards, and also includes blues, jazz blues, modal jazz, traditional songs, and popular tunes. Currently, the dataset comprises 2,612 songs, totaling 134,182 chords, with 1,542 unique symbols. It represents the largest known digital collection of jazz chord progressions, aiming to contribute to research in the fields of music information retrieval, music informatics, and musicology.
创建时间:
2022-05-18
原始信息汇总

数据集概述

数据集名称

Jazz Chord Progressions Corpus

数据集内容

  • 类型: 符号化和弦进行
  • 来源: 主要来自爵士标准曲目,还包括蓝调、爵士蓝调、模态爵士、传统歌曲和流行曲目
  • 规模: 包含2,612首歌曲,总计134,182个和弦,其中1,542个独特符号
  • 特点: 包含一些重复歌曲,但具有不同的和声处理

数据集结构

  • 存储位置: SongDB目录
  • 文件格式: 每个歌曲文件为ASCII格式,文件名基于歌曲标题(不包含前置冠词如“The”和“A”)
  • 组织方式: 数据库分为三个子目录,每个子目录约含900首歌曲,按歌曲标题首字母分区

文件内容

  • 元数据: 包括标题、作曲者、调号、拍号和总小节数
  • 和弦进行: 以四小节为一行展示,每小节以“|”符号结束,每个小节内的和弦按拍号分配

使用示例

  • 示例歌曲: "Have You Met Miss Jones?"
  • 内容展示: 包括歌曲标题、作曲者、调号、拍号和完整的32小节和弦进行

数据集用途

  • 研究目的: 用于音乐信息检索、音乐信息学和音乐学领域的研究和实验
  • 相关文献: 包含一篇关于和声相似性建模的论文,以及用于生成主要结果的代码

贡献与更新

  • 更新历史: 已修正许多错误并添加了缺失信息,还包括了非原始集合中的新歌曲
  • 贡献方式: 欢迎外部贡献和更正
搜集汇总
数据集介绍
main_image_url
构建方式
Jazz Chord Progressions Corpus数据集的构建源于开源音乐符号程序*Impro-Visor*中的*Imaginary Book*文件集合。这些文件经过修改,保留了音乐特定的内容,移除了仅适用于*Impro-Visor*应用程序的控制信息。在此基础上,维护者对原始集合进行了大量错误修正和信息补充,并添加了部分未包含在*Imaginary Book*中的歌曲。最终,该数据集包含了2,612首歌曲,共计134,182个和弦,其中包含1,542个独特的和弦符号,形成了目前已知的最大爵士和弦进行数字集合。
特点
该数据集的特点在于其广泛覆盖了爵士标准曲目、蓝调、爵士蓝调、模态爵士、传统歌曲以及流行曲目等多种音乐风格。每首歌曲的和弦进行以符号形式完整呈现,避免了任何简写形式,如重复符号或多重结尾。此外,数据集还提供了每首歌曲的元数据,包括标题、作曲家、调号、拍号以及总小节数。这些信息以ASCII格式存储,便于用户进行搜索和分析。数据集还通过分区存储的方式,将歌曲按标题首字母分为三个子目录,以应对GitHub的文件数量限制。
使用方法
使用Jazz Chord Progressions Corpus数据集时,用户可通过SongDB目录访问所有歌曲文件,每首歌曲以独立文件形式存储。文件内容包含元数据和完整的和弦进行,每四个小节为一行,小节之间以竖线符号分隔。用户可通过读取文件内容,获取歌曲的详细和弦信息,并结合提供的元数据进行音乐信息检索、音乐信息学或音乐学研究。此外,数据集中附带的论文和代码为用户提供了建模和测量和弦相似性的方法,便于进一步的研究和应用。
背景与挑战
背景概述
Jazz Chord Progressions Corpus 是一个专注于爵士乐和弦进行的数据集,旨在为音乐信息检索、音乐信息学和音乐学领域的研究提供支持。该数据集由研究人员 Bunks、Dixon、Weyde 和 Di Giorgi 等人于2023年创建,基于开源音乐符号程序 *Impro-Visor* 的 *Imaginary Book* 文件集合构建而成。数据集包含2,612首歌曲,涵盖134,182个和弦,其中包含1,542个独特的和弦符号。这些和弦进行主要来自爵士标准曲目,同时也包含布鲁斯、爵士布鲁斯、模态爵士、传统歌曲和流行曲目。该数据集的构建为爵士乐和声相似性建模提供了重要的实验基础,并在国际音乐信息检索会议(ISMIR)上发表了相关研究成果。
当前挑战
Jazz Chord Progressions Corpus 的构建面临多重挑战。首先,在领域问题方面,爵士乐和弦进行的复杂性极高,其丰富的和声变化和即兴特性使得建模和相似性度量变得极为困难。数据集的目标是通过符号化表示捕捉这些复杂的和声结构,从而支持音乐信息检索中的和声分析任务。其次,在数据构建过程中,研究人员需要对原始 *Imaginary Book* 文件进行大量修正和补充,包括纠正错误、添加缺失信息以及扩展曲目库。此外,由于 GitHub 的文件数量限制,数据集不得不被分割为多个子目录,这增加了数据管理和访问的复杂性。这些挑战凸显了在音乐信息学领域构建高质量符号化数据集的难度。
常用场景
经典使用场景
Jazz Chord Progressions Corpus数据集在音乐信息检索和音乐学研究中具有重要应用。该数据集包含了大量爵士乐标准曲目的和弦进行,为研究人员提供了一个丰富的资源库,用于分析和建模爵士乐的和声结构。通过该数据集,研究者可以深入探讨爵士乐中的和弦变化规律,进而推动音乐信息检索技术的发展。
解决学术问题
该数据集解决了音乐信息检索领域中的多个关键问题,尤其是爵士乐和声相似性建模的挑战。通过提供大量真实的和弦进行数据,研究者能够开发出更精确的算法来测量和比较不同曲目之间的和声相似性。这不仅有助于理解爵士乐的和声结构,还为音乐推荐系统和自动作曲工具的开发提供了理论基础。
衍生相关工作
基于Jazz Chord Progressions Corpus数据集,研究者们已经开展了多项经典工作。例如,Bunks等人利用该数据集开发了一种基于共现向量和膜面积的和声相似性建模方法,并在国际音乐信息检索会议(ISMIR)上发表了相关研究成果。这些工作不仅验证了数据集的有效性,还为后续研究提供了宝贵的参考和借鉴。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作