Instrumental Similarity ABX Dataset
收藏github2024-09-04 更新2024-09-13 收录
下载链接:
https://github.com/zume06/Inst-Sim-ABX-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于乐器声音和音乐片段相似性标注的数据集,包含从salkh2100数据集测试集中收集的实验响应数据和测试集配置信息。数据集包括参与者的响应数据和每个测试集样本的配置信息。
This is a dataset for similarity annotation of instrument sounds and music clips, containing experimental response data and test set configuration information collected from the test set of the Salkh2100 dataset. The dataset includes response data from participants as well as configuration information for each test set sample.
创建时间:
2024-08-23
原始信息汇总
Instrumental Similarity ABX Dataset
概述
该数据集包含对乐器声音和音乐片段的相似性注释,基于salkh2100数据集的测试集。数据集包含实验中收集的响应数据以及实验中使用的测试集的配置信息。
目录结构
./csvs/- 包含实验参与者的响应数据。
./sample_configs/- 存储每个测试集样本的配置信息的JSON文件。
文件描述
1. ./csvs/inst_sim_abx_answers.csv
- 内容:包含实验参与者的响应数据。
- 列描述:
ex_name:实验IDsubject_id:参与者IDreference:参考声音的路径sample_a:样本A的路径sample_b:样本B的路径answer_timbre:基于音色相似性的选择answer_rhythm:基于节奏相似性的选择answer_melody:基于旋律相似性的选择answer_total:总体相似性选择choice_time:做出选择所用的时间(毫秒)
2. ./csvs/inst_sim_abx_answers_XAB.csv 和 ./csvs/inst_sim_abx_answers_XYC.csv
- 内容:从
inst_sim_abx_answers.csv中拆分出的两个部分。 - 描述:
inst_sim_abx_answers_XAB.csv:仅包含XAB测试的结果。inst_sim_abx_answers_XYC.csv:仅包含XYC测试的结果。
3. ./sample_configs/dict_triplet_202404.json 和 ./sample_configs/dict_triplet_202407.json
- 内容:包含每个测试集样本的配置信息。
- 格式:
- 每个测试集包含多个乐器类别(如鼓、贝斯),每个类别有三个样本:Sample X、Sample Y、Sample C。
- 每个样本包含以下信息:
ID:slakh 2100数据集的IDseg:片段编号filename:文件名sr:采样率(Hz)index_s:样本的起始索引index_e:样本的结束索引
引用
该数据集仅供研究使用,需引用arXiv论文。详细信息将在arXiv论文中分享。
搜集汇总
数据集介绍

构建方式
在音乐声学领域,Instrumental Similarity ABX Dataset通过精心设计的实验收集了大量的相似性评估数据。该数据集的核心构建方式是利用salkh2100数据集中的乐器声音和音乐片段,设计了两类测试集:XAB和XYC。在XAB测试中,随机选取三个不同的音乐片段,每个片段截取5秒进行比较;而在XYC测试中,Y是与X同一音乐片段的不同时间段,C则是来自不同音乐片段。实验要求参与者根据音色、节奏、旋律和整体相似性四个标准,判断两个样本中哪一个更接近参考声音。所有参与者的响应数据被整理成CSV文件,并根据测试类型进一步细分为两个子集。
使用方法
使用Instrumental Similarity ABX Dataset时,研究者首先需下载包含响应数据的CSV文件和样本配置的JSON文件。CSV文件提供了参与者对每个样本的详细评估结果,而JSON文件则包含了每个测试集的样本配置信息。研究者可以根据需要选择特定的测试集(XAB或XYC)进行分析,并利用配置信息提取相应的音频片段。此外,数据集还提供了详细的列描述和文件结构,帮助用户快速理解和处理数据。在使用过程中,务必遵循数据集的使用许可,并在相关研究中引用即将发布的arXiv论文。
背景与挑战
背景概述
Instrumental Similarity ABX Dataset 是一个专注于乐器声音相似性评估的数据集,源自salkh2100数据集的测试集。该数据集由日本名古屋大学(Nagoya University)的研究团队创建,旨在通过实验收集参与者对不同乐器声音相似性的主观评价数据。数据集的核心研究问题在于探索和量化乐器声音在音色、节奏、旋律及整体相似性方面的差异。这一研究不仅丰富了音乐信息检索(MIR)领域的数据资源,还为乐器声音的自动分类和相似性分析提供了宝贵的实验数据。
当前挑战
Instrumental Similarity ABX Dataset 在构建过程中面临多项挑战。首先,实验设计需确保参与者能够准确区分不同乐器声音的相似性,这要求实验设置既科学又易于理解。其次,数据集的多样性和代表性是另一大挑战,确保涵盖多种乐器和音乐片段,以反映实际应用中的复杂性。此外,数据处理和分析过程中,如何有效去除无效答案和处理主观评价的不一致性,也是该数据集需要解决的重要问题。
常用场景
经典使用场景
在音乐信息检索领域,Instrumental Similarity ABX Dataset 被广泛用于评估乐器声音的相似性。研究者通过分析数据集中的响应数据,可以深入探讨不同乐器在音色、节奏、旋律和整体相似性方面的差异。这种分析不仅有助于理解听众对音乐相似性的感知,还能为音乐推荐系统和音乐分类算法提供宝贵的数据支持。
解决学术问题
该数据集解决了音乐信息检索中的一个核心问题,即如何量化和评估乐器声音的相似性。通过提供详细的实验数据和配置信息,研究者能够开发和验证新的算法,以更准确地捕捉和描述音乐中的细微差别。这不仅推动了音乐信息检索技术的发展,还为音乐心理学和认知科学提供了新的研究视角。
实际应用
在实际应用中,Instrumental Similarity ABX Dataset 为音乐推荐系统、音乐分类和音乐生成模型提供了重要的数据支持。例如,通过分析数据集中的相似性评估,开发者可以优化推荐算法,使其更准确地匹配用户的音乐偏好。此外,该数据集还可用于训练和验证音乐生成模型,以确保生成的音乐片段在音色和旋律上与参考音乐保持一致。
数据集最近研究
最新研究方向
在音乐与声音处理领域,Instrumental Similarity ABX Dataset 的最新研究方向主要集中在利用深度学习技术分析和预测乐器声音的相似性。通过该数据集提供的详细标注和配置信息,研究者们能够训练模型以识别和区分不同乐器声音的音色、节奏和旋律特征。此外,该数据集还支持对音乐片段的时间分割和采样率分析,从而推动了音乐信息检索和音乐生成技术的发展。这些研究不仅有助于提升音乐推荐系统的准确性,还为音乐创作和编辑提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成



