Coordinated Corpus of Popular Music (CoCoPops)
收藏github2024-03-06 更新2024-05-31 收录
下载链接:
https://github.com/Computational-Cognitive-Musicology-Lab/CoCoPops
下载链接
链接失效反馈官方服务:
资源简介:
CoCoPops是一个流行音乐旋律和和声转录的元数据集,由Georgia Tech的计算与认知音乐学实验室开发。它包括两个主要子数据集:Billboard和Rolling Stone,旨在提供大量可比较的旋律/和声数据,并以一致的标准化格式存储。
CoCoPops,作为一款备受推崇的流行音乐旋律与和声转录元数据集,由乔治亚理工学院计算与认知音乐学实验室精心打造。该数据集涵盖了两个核心子集:Billboard与Rolling Stone,旨在为广大研究者提供丰富的、可对比的旋律与和声数据,并采用统一的标准化格式进行存储。
创建时间:
2023-10-07
原始信息汇总
CoCoPops: The Coordinated Corpus of Popular Musics
数据集概述
CoCoPops是一个关于流行音乐旋律和和声转录的元数据集。该数据集由Nat Condit-Schultz和Claire Arthur在Georgia Tech的Computational and Cognitive Musicology Lab开发。数据集包含两个主要子集:Billboard和Rolling Stone。
数据内容与格式
- 格式: 所有文件存储在humdrum格式中。
- 子集:
- Billboard: 包含McGill Billboard Dataset的转录,以及214首新专家旋律转录。
- RollingStone: 包含RS200的转录。
- 总数: 目前包含414个完整的旋律-和声转录,涉及398首独特曲目。
文件命名规范
- 文件名格式为
Artist_Title_Year.extension。 - 艺术家和标题部分仅包含罗马字母和阿拉伯数字,不包含特殊字符。
- 年份部分为歌曲被采样的年份,不一定与歌曲发行年份相同。
引用信息
- 引用该数据集的详细信息,请参考2023年ISMIR会议论文。
搜集汇总
数据集介绍

构建方式
CoCoPops数据集由乔治亚理工学院音乐技术中心的计算与认知音乐学实验室开发,主要贡献者包括Nat Condit-Schultz和Claire Arthur。该数据集整合了流行音乐的旋律与和声转录数据,采用humdrum格式进行标准化存储。数据集包含两个主要子集:Billboard子集和Rolling Stone子集。Billboard子集涵盖了McGill Billboard数据集的所有内容,并新增了214首歌曲的专家旋律转录;Rolling Stone子集则包含了RS200数据集的全部内容。所有转录数据均附有形式信息和时间戳,确保数据的完整性和一致性。
特点
CoCoPops数据集以其丰富的旋律与和声转录数据著称,涵盖了398首独特曲目的414个完整转录。数据集采用统一的humdrum格式,确保数据的可比性和易用性。每个子集均包含详细的元数据,如艺术家、曲目名称和年份信息,便于用户进行精确检索和分析。此外,数据集的文件命名遵循严格的规范,确保文件命名的统一性和可读性。CoCoPops的构建旨在为音乐信息检索和音乐学研究提供高质量的标准化数据资源。
使用方法
CoCoPops数据集的使用方法简便直观,用户可通过GitHub仓库访问数据集文件。每个子集均存储在其独立的子目录中,并附有详细的README文件,解释目录结构和内容。数据集文件采用humdrum格式,用户可使用支持该格式的软件进行数据解析和分析。此外,数据集提供了完整的曲目列表文件(CoCoPops_Sample.tsv),便于用户快速浏览和筛选所需数据。用户可根据研究需求,引用相关文献以支持其研究工作,确保学术规范和数据来源的透明性。
背景与挑战
背景概述
Coordinated Corpus of Popular Music (CoCoPops) 是由乔治亚理工学院音乐技术中心的计算与认知音乐学实验室的Nat Condit-Schultz和Claire Arthur主导开发的一个元语料库,专注于流行音乐的旋律与和声转录。该数据集旨在为研究者提供一个大规模、标准化格式的旋律与和声数据资源,以便于进行音乐信息检索、音乐分析和认知音乐学等领域的研究。CoCoPops目前包含两个主要子集:Billboard子集和Rolling Stone子集,分别整合了McGill Billboard Dataset和RS200数据集,并新增了专家转录的旋律数据。该数据集自2023年发布以来,已成为流行音乐研究领域的重要资源,为音乐分析提供了丰富的数据支持。
当前挑战
CoCoPops在构建过程中面临多重挑战。首先,流行音乐的旋律与和声转录需要高度的音乐学专业知识,确保转录的准确性与一致性。其次,不同来源的数据格式各异,将其统一转换为humdrum格式需要大量的技术处理与标准化工作。此外,数据集中的歌曲涉及多种风格与年代,如何确保转录的通用性与代表性也是一个难题。在应用层面,CoCoPops的目标是支持音乐信息检索与音乐分析,但如何利用这些数据开发高效的算法与模型,仍是一个亟待解决的问题。这些挑战不仅体现在数据集的构建过程中,也对其在相关领域的实际应用提出了更高的要求。
常用场景
经典使用场景
CoCoPops数据集在音乐信息检索领域中被广泛用于分析流行音乐的旋律与和声结构。研究者通过该数据集,能够深入探讨流行音乐中的旋律模式、和声进行及其与音乐情感表达之间的关系。该数据集的标准格式和丰富的元数据为音乐分析提供了坚实的基础,使得研究者能够进行跨歌曲、跨年代的比较研究。
解决学术问题
CoCoPops数据集解决了音乐信息检索领域中缺乏标准化旋律与和声数据的问题。通过整合多个流行音乐子集,该数据集为研究者提供了一个统一的平台,用于分析流行音乐的结构特征。其标准化的数据格式和详细的元信息使得研究者能够进行更精确的统计分析,从而推动了音乐理论与计算音乐学的发展。
衍生相关工作
CoCoPops数据集衍生了许多经典的研究工作,例如基于该数据集的音乐情感分析、旋律生成模型以及和声模式识别算法。这些研究不仅深化了对流行音乐结构的理解,还为音乐信息检索技术的发展提供了新的思路。此外,该数据集还被用于跨文化音乐研究,探讨不同地区流行音乐的旋律与和声特征,进一步拓展了音乐学的研究视野。
以上内容由遇见数据集搜集并总结生成



