five

irish-tunes-csi

收藏
Hugging Face2025-11-21 更新2025-11-22 收录
下载链接:
https://huggingface.co/datasets/alanngnet/irish-tunes-csi
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于机器学习的爱尔兰传统音乐测试数据集,旨在支持开发能够对爱尔兰传统舞蹈音乐进行良好分类的模型,进而深入研究这种音乐的音乐特性。数据集包括三个子数据集:Reels50hard、Reels50easy和Reels50transpose,分别聚焦于不同的挑战,如识别特定曲调、处理音乐转调等。每个子数据集都提供两种变体:'main'和'melody',使用不同的常数Q变换(CQT)参数。
创建时间:
2025-11-18
原始信息汇总

爱尔兰传统音乐机器学习测试数据集概述

数据集基本信息

  • 名称: Irish Traditional Music Test Datasets for Machine Learning
  • 许可证: CC BY-NC 4.0
  • 语言: 英语
  • 任务类别: 音频分类
  • 标签: 音频、表格数据、音乐、爱尔兰传统音乐、翻唱歌曲识别

数据集目的

支持开发在爱尔兰传统舞蹈音乐方面表现良好的分类模型,促进对该音乐音乐特征的研究。

数据集组成

测试集类型

  • Reels50hard: 50首特别具有挑战性的里尔舞曲
  • Reels50easy: 50首里尔舞曲,与"hard"集无重叠
  • Reels50transpose: 50首专注于音调转换挑战的里尔舞曲

数据变体

  • main变体: 使用默认CoverHunter设置

    • 采样率: 16 kHz
    • 跳数大小: 0.04秒
    • 八度分辨率: 12步
    • 最低频率: 32 Hz
    • 频率箱: 96个
  • melody变体: 更适合识别旋律内容

    • 采样率: 16 kHz
    • 跳数大小: 0.04秒
    • 八度分辨率: 12步
    • 最低频率: 170 Hz
    • 频率箱: 60个

技术规格

  • 特征提取: 基于CQT(恒定Q变换)特征
  • 文件格式: CQT文件存储为.npy格式
  • 文件命名: workID.perfID.cqt.npy
  • 元数据: 包含在full.txt文件中

数据集详情

Reels50easy

  • 每首里尔舞曲恰好有3个演奏版本
  • 所有演奏版本共享相同的8小节结构
  • 曲目之间无音乐相似性

Reels50hard

  • 每首里尔舞曲约有5个不同演奏版本
  • 专门选择对机器学习模型具有挑战性的演奏

Reels50transpose

  • 专注于识别跨音调转换的音乐身份
  • 尽可能与Reels50hard测试集重叠
  • 尽可能将每首作品的演奏修剪为成对

使用说明

  • 设计用于CoverHunterMPS项目的train.py和eval_testset.py脚本
  • 任何依赖CQT特征的模型均可使用
  • 数据集应放置在CoverHunterMPS项目的data文件夹中

基准测试

数据集已用于CoverHunterMPS模型的性能评估,相关指标已发布。

引用信息

使用此数据集时请引用DOI: https://doi.org/10.57967/hf/7039 作者: Alan Ng

搜集汇总
数据集介绍
main_image_url
构建方式
在爱尔兰传统音乐研究领域,该数据集通过系统化采集与处理构建而成。音频素材源自irishtune.info曲库,采用恒定Q变换技术提取频谱特征,分别生成包含96个频率区间的标准版本和60个频率区间的旋律优化版本。每个子集均经过专业音乐学者的精心筛选,其中Reels50hard收录具有挑战性的演奏变体,Reels50easy聚焦结构清晰的曲目,Reels50transpose则专门针对音调转换场景设计,所有样本均附带完整的元数据标注。
使用方法
该数据集专为CoverHunterMPS框架优化设计,使用者可通过修改项目中的hparams.yaml配置文件启用对应测试集。将解压后的数据文件置于项目data目录后,既可配合train.py脚本进行模型训练,也能通过eval_testset.py实现性能评估。评估过程支持生成t-SNE可视化图谱,便于直观分析模型在传统音乐识别任务中的特征学习效果。对于其他基于CQT特征的模型架构,本数据集同样可作为标准化的爱尔兰传统音乐基准测试资源。
背景与挑战
背景概述
爱尔兰传统音乐机器学习测试数据集由研究者Alan Ng于2024年创建,旨在填补民族音乐文化中翻唱识别研究的空白。该数据集聚焦于爱尔兰传统舞曲的旋律特征分析,通过构建Reels50hard、Reels50easy和Reels50transpose三个子集,为音乐信息检索领域提供了首个针对特定文化场景的覆盖歌曲识别基准。其核心研究问题在于探索机器学习模型如何模拟人类专家对爱尔兰里尔舞曲的细粒度辨识能力,推动了跨文化音乐计算研究的发展。
当前挑战
该数据集主要应对传统音乐翻唱识别中旋律结构高度相似性与演奏变体多样性的核心难题,具体表现为模型需区分具有相同八小节框架但即兴装饰音不同的演奏版本。构建过程中面临双重挑战:一是数据标注需依赖民族音乐学专业知识,确保每首曲目的文化归属与结构特征准确性;二是音频特征提取需平衡恒定Q变换参数,在96频段与60频段变体间优化旋律内容与频谱分辨率的表征能力。
常用场景
经典使用场景
在爱尔兰传统音乐研究领域,该数据集为覆盖歌曲识别任务提供了专门化的评估基准。通过包含难度各异的里尔舞曲子集,研究者能够系统测试机器学习模型在特定文化音乐语境下的辨识能力,尤其聚焦于模型对人类专家级音乐区分能力的模拟。
解决学术问题
该数据集填补了民族音乐学与计算音乐学的交叉研究空白,通过构建文化特异性音乐数据集,解决了传统覆盖歌曲识别模型在民俗音乐场景中泛化能力不足的难题。其分级难度设计为音乐特征提取算法的鲁棒性评估提供了量化标准,推动了跨文化音乐认知计算模型的发展。
实际应用
该数据集的实际价值体现在民族音乐数字化保护工程中,为构建文化自适应音乐检索系统提供核心训练资源。音乐学者可基于此开发本土化音乐分类工具,应用于传统音乐档案馆的智能编目、民间音乐传承教学平台的曲库管理,以及跨地域音乐流派的自动化比对分析。
数据集最近研究
最新研究方向
在民族音乐计算分析领域,爱尔兰传统音乐数据集irish-tunes-csi正推动覆盖歌曲识别研究向文化特异性方向深化。该数据集通过Reels50hard、Reels50easy和Reels50transpose三个子集,构建了针对爱尔兰里尔舞曲的细粒度识别基准,其特色在于采用恒定Q变换特征与CoverHunterMPS框架结合,有效解决了传统CSI模型在跨文化音乐识别中的适应性瓶颈。当前研究热点集中于多频段特征融合与跨音高变换建模,2025年发布的评测数据显示,基于该数据集训练的模型在保持旋律辨识精度的同时,显著提升了对于民族音乐变奏风格的鲁棒性,为数字音乐学领域建立文化敏感的计算模型提供了重要范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作