fifteen-songs-dataset
收藏github2020-10-26 更新2024-05-31 收录
下载链接:
https://github.com/grateful-dead-live/fifteen-songs-dataset
下载链接
链接失效反馈官方服务:
资源简介:
一个小型的声音板录音集合,包含15首感恩而死乐队的不同表演版本(总共2617个版本),发布在互联网档案馆的Live Music Archive中。歌曲根据档案中的元数据分类,部分可能标签错误。数据集包括每首歌曲的所有版本及其建议的调音比率,以及每首歌曲的领谱。
A small collection of soundboard recordings featuring 15 different performances by the Grateful Dead (totaling 2,617 versions), released on the Internet Archive's Live Music Archive. The songs are categorized based on metadata from the archive, with some potentially mislabeled. The dataset includes all versions of each song along with their suggested tuning ratios, as well as the lead sheets for each song.
创建时间:
2020-07-29
原始信息汇总
数据集概述
数据集名称
fifteen-songs-dataset
数据集内容
- 音频文件: 包含2617个版本的15首Grateful Dead歌曲的现场录音。
- 分类依据: 基于Live Music Archive的元数据进行分类,部分可能存在标签错误。
- 文件结构:
dataset.json: 包含每首歌的所有版本及其建议的调音比率。leadsheets文件夹: 包含每首歌的领谱,来源包括JDarks和Ultimate Guitar。
音频处理
- 原始音频: 存储在
original_audio目录。 - 调音后音频: 存储在
dataset目录。
歌曲列表
- Box of Rain (85 versions)
- Casey Jones (181 versions)
- China Cat Sunflower (181 versions)
- China Doll (65 versions)
- Cosmic Charlie (56 versions)
- Cumberland Blues (132 versions)
- Dancin in the Streets (68 versions)
- Dark Star (139 versions)
- Estimated Prophet (223 versions)
- Eyes of the World (218 versions)
- Franklins Tower (126 versions)
- Scarlet Begonias (184 versions)
- Ship of Fools (138 versions)
- Sugar Magnolia (351 versions)
- Truckin (315 versions)
引用信息
- 首次使用于: Florian Thalmann, Kazuyoshi Yoshii, Thomas Wilmering, Geraint Wiggins, Mark Sandler. A Method for Analysis of Shared Structure in Large Music Collections using Techniques from Genetic Sequencing and Graph Theory, ISMIR 2020.
- 引用要求: 如使用本数据集,请引用上述论文。
搜集汇总
数据集介绍

构建方式
该数据集构建于互联网档案馆的现场音乐存档中,收录了15首Grateful Dead乐队的歌曲,共计2617个不同版本的录音。每首歌曲的版本信息及其建议的调音比率均记录在`dataset.json`文件中。此外,数据集还包含一个`leadsheets`文件夹,其中收录了每首歌曲的乐谱,这些乐谱来源于自主转录及在线资源如JDarks和Ultimate Guitar。
特点
fifteen-songs-dataset的特点在于其丰富的版本多样性,涵盖了15首经典歌曲的多个现场表演版本。每首歌曲的录音均经过调音处理,并提供了详细的元数据信息。数据集还附带了乐谱资源,为音乐分析和研究提供了多维度支持。这些歌曲的选择基于其版本数量丰富且均有对应的参考录音,确保了数据的广泛性和代表性。
使用方法
使用该数据集时,用户需克隆GitHub仓库并运行`python dataset.py`脚本,以自动下载并重采样音频文件。下载后的音频文件将分别存储在`original_audio`和`dataset`文件夹中,前者为未调音版本,后者为调音后的版本。每首歌曲的音频文件均按歌曲名称分类存储,便于用户按需调用。数据集的使用需引用相关研究论文,以确保学术规范。
背景与挑战
背景概述
fifteen-songs-dataset数据集由Florian Thalmann等研究人员于2020年创建,旨在通过分析Grateful Dead乐队的15首歌曲的不同现场表演版本,探索音乐共享结构的分析方法。该数据集收录了2617个版本的音频文件,涵盖了乐队在不同时间和地点的表演。这些音频文件来源于互联网档案馆的Live Music Archive,并通过元数据进行了分类。该数据集的核心研究问题在于如何利用遗传测序和图论技术,分析大规模音乐集合中的共享结构。这一研究为音乐信息检索领域提供了新的视角,尤其在音乐版本比较和结构分析方面具有重要影响力。
当前挑战
fifteen-songs-dataset面临的挑战主要体现在两个方面。首先,音乐版本比较的复杂性是该数据集试图解决的核心问题。由于同一首歌曲在不同表演中可能存在显著差异,如何准确捕捉和量化这些差异是一个技术难点。其次,在数据集构建过程中,研究人员面临了音频文件质量不一致、元数据标签错误以及音频调谐等技术挑战。此外,尽管数据集提供了调谐后的音频文件,但调谐过程的准确性和一致性仍需进一步验证,以确保研究结果的可靠性。
常用场景
经典使用场景
在音乐信息检索领域,fifteen-songs-dataset数据集被广泛应用于音乐结构分析和版本比较研究。通过对2617个不同版本的15首Grateful Dead歌曲进行深入分析,研究者能够探索同一歌曲在不同演出中的变化和共性,从而揭示音乐创作的动态过程。
衍生相关工作
基于fifteen-songs-dataset数据集,研究者们开展了多项经典工作。例如,Florian Thalmann等人利用该数据集提出了基于遗传序列和图论的音乐结构分析方法,为大规模音乐集合的共享结构研究开辟了新途径。此外,该数据集还激发了更多关于音乐版本识别和旋律变化检测的研究,推动了音乐信息检索领域的进一步发展。
数据集最近研究
最新研究方向
在音乐信息检索领域,fifteen-songs-dataset为研究者提供了一个独特的资源,专注于Grateful Dead乐队的15首歌曲的多个现场版本。这些数据不仅包含了丰富的音频记录,还附带了调音比例和乐谱信息,为音乐结构分析和版本比较研究提供了宝贵的素材。近年来,该数据集被广泛应用于音乐相似性分析、版本识别以及音乐演化研究。特别是在利用遗传序列和图论技术分析大规模音乐集合中的共享结构方面,该数据集展现了其独特的价值。随着音乐信息检索技术的不断进步,fifteen-songs-dataset在音乐风格演变、现场表演分析以及音乐推荐系统等前沿研究方向中,将继续发挥重要作用。
以上内容由遇见数据集搜集并总结生成



