five

Chordonomicon

收藏
arXiv2024-10-29 更新2024-10-31 收录
下载链接:
https://huggingface.co/datasets/ailsntua/Chordonomicon
下载链接
链接失效反馈
官方服务:
资源简介:
Chordonomicon是由希腊雅典国立技术大学人工智能与学习系统实验室创建的一个包含667,858首歌曲及其和弦进程的大型数据集。该数据集通过网络爬虫从Ultimate Guitar平台收集,经过音乐专家的精心筛选和格式化,确保了和弦术语的准确性。数据集不仅包含和弦进程,还标注了结构部分、流派和发行日期,适用于音乐信息检索、分类和生成任务。Chordonomicon的独特之处在于其多样的表示格式(如文本、图)和丰富的音乐理论知识,使其成为探索高级机器学习技术的理想平台。

Chordonomicon is a large-scale dataset encompassing 667,858 songs and their corresponding chord progressions, developed by the Artificial Intelligence and Learning Systems Laboratory of the National Technical University of Athens, Greece. This dataset was collected from the Ultimate Guitar platform via web crawling, then meticulously filtered and formatted by music experts to ensure the accuracy of chord terminology. In addition to chord progressions, the dataset also annotates structural sections, musical genres, and release dates, making it suitable for music information retrieval, classification, and generation tasks. What distinguishes Chordonomicon is its diverse representation formats (e.g., text and graphs) and rich musical theoretical knowledge, rendering it an ideal platform for exploring advanced machine learning techniques.
提供机构:
希腊雅典国立技术大学人工智能与学习系统实验室
创建时间:
2024-10-29
原始信息汇总

Chordonomicon

概述

Chordonomicon是一个大规模的数据集,包含了超过666,000个当代音乐作品的符号表示,主要通过音乐和弦及和弦进行来表示。

数据内容

  • 和弦及和弦进行:超过666,000个音乐作品的符号表示。
  • 元数据:包括流派、子流派和发行日期等详细信息。
  • 结构信息:与音乐作品不同部分相关的结构信息。

引用

如使用此数据集,请引用相关论文:https://doi.org/10.48550/arXiv.2410.22046。

许可证

MIT许可证。

搜集汇总
数据集介绍
main_image_url
构建方式
Chordonomicon数据集的构建基于对Ultimate Guitar平台的大规模网络爬取,遵循了该平台的robots.txt文件、服务条款以及网络可访问性协议。通过筛选包含‘-chords-’子字符串的URL,获取了140万首歌曲的和弦页面,并进一步整合了用户评分、投票数、艺术家ID和歌曲标题等信息。经过数据清洗和专家审核,最终保留了667,858首独特的歌曲和弦进行,确保了数据的高质量和一致性。
特点
Chordonomicon数据集的显著特点在于其规模庞大,包含了超过666,000首歌曲的和弦进行,并附有结构部分、流派和发布日期等元数据。此外,该数据集支持多种格式的表示,如文本和图表,使其成为探索高级机器学习技术的理想平台,包括变压器模型、图机器学习和混合系统。
使用方法
Chordonomicon数据集可广泛应用于音乐信息检索(MIR)领域的分类和生成任务。用户可以通过提供的Python脚本进行数据增强、和弦转换和二进制表示生成。此外,数据集的图表表示形式为图神经网络(GNN)等复杂分析方法提供了基础,支持对音乐结构和流派的深入研究。
背景与挑战
背景概述
Chordonomicon数据集由希腊雅典国立技术大学的人工智能与学习系统实验室创建,旨在解决音乐和弦进行领域中大规模数据集的缺乏问题。该数据集包含了超过666,000首歌曲及其和弦进行,并附有结构部分、流派和发布日期等元数据。Chordonomicon的推出填补了音乐信息检索(MIR)领域中关于和弦进行研究的空白,为深度学习和机器学习技术在音乐分析中的应用提供了丰富的资源。其独特的多格式表示(如文本、图)和丰富的和弦信息,使其成为探索高级机器学习技术(如变压器、图机器学习和混合系统)的理想平台。
当前挑战
Chordonomicon数据集面临的挑战主要包括:1) 解决音乐和弦进行领域的数据稀缺问题,特别是在深度学习应用中;2) 构建过程中遇到的版权问题,尽管数据集使用了非版权保护的用户生成和弦进行,但仍需确保合法性;3) 数据集的多格式表示和丰富的和弦信息,虽然提供了多样化的研究机会,但也增加了数据处理的复杂性;4) 和弦进行在不同音乐流派中的相似性,使得分类任务变得复杂,需要更精细的和弦分析以提高分类准确性。
常用场景
经典使用场景
Chordonomicon数据集的经典使用场景主要集中在音乐信息检索(MIR)领域,特别是在和弦识别和音乐生成任务中。该数据集通过提供超过666,000首歌曲及其和弦进程的详细信息,为研究人员提供了一个丰富的资源库,用于训练和评估深度学习模型。这些模型可以用于自动生成音乐、分析音乐结构,以及识别和弦进程中的模式和规律。
解决学术问题
Chordonomicon数据集解决了音乐信息检索领域中长期存在的数据稀缺问题。通过提供大规模的和弦进程数据,该数据集为研究人员提供了一个强大的工具,用于探索和弦进程的复杂性及其在音乐中的应用。这不仅推动了和弦识别技术的发展,还为音乐生成和分析提供了新的可能性,从而在学术界产生了深远的影响。
衍生相关工作
Chordonomicon数据集的发布激发了一系列相关研究工作,特别是在和弦识别和音乐生成领域。例如,基于该数据集的研究已经探索了使用图神经网络(GNNs)和变压器模型进行和弦预测。此外,还有研究致力于将音乐理论知识图谱与机器学习模型结合,以提高音乐分析和生成的准确性和解释性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作