five

NeuroPiano

收藏
arXiv2024-10-04 更新2024-10-08 收录
下载链接:
https://huggingface.co/datasets/anusfoil/NeuroPiano-data
下载链接
链接失效反馈
官方服务:
资源简介:
NeuroPiano数据集由索尼计算机科学实验室东京分部和伦敦玛丽女王大学数字音乐中心共同创建,包含104段高级学生钢琴演奏的音频记录,涵盖六种标准技术练习。数据集包含2255条音频-问题-答案三元组,由45位专业钢琴家提供文本反馈和评分。数据集的创建旨在通过分析音频、文本和评分模式之间的关系,探索音乐信息检索技术在音乐教育中的应用,特别是自动化反馈机制和个性化学习体验的提升。
提供机构:
伦敦玛丽女王大学数字音乐中心,索尼计算机科学实验室东京分部
创建时间:
2024-10-04
原始信息汇总

数据集卡片:NeuroPiano-data

概述

该数据集包含2255个音频-问题-答案对,专注于音乐教育。问题范围从音符的清晰度到手的平衡,每个问题都附有口头回答以及6分制评分。数据集中有104个独特的学生钢琴练习录音,其中部分由多位教师评分。

数据集详情

数据集描述

  • 创建者: Hayato Nishioka, Vincent Cheung, Huan Zhang, Shinichi Furuya
  • 资助: Japan Science and Technology Agency CREST grant [number JPMJCR20D4]
  • 共享者: Huan Zhang
  • 语言: 日语, 英语
  • 许可证: MIT License

数据集结构

每个条目包含:

  • audio_path: 加载的音频,采样率为48000
  • piece: 练习曲的名称,附有练习曲的PDF乐谱
  • subject: 评分者的ID
  • question: 日语问题
  • answer: 日语回答
  • q_eng: 英语问题
  • a_eng: 英语回答
  • score: 评分,范围为6分制

数据集创建

  • 数据来源: NeuroPiano Academy (https://www.neuropiano.org/)的学生和教师
  • 个人信息: 数据集中没有敏感或个人信息,所有身份均已匿名化

引用

BibTeX: [Coming Soon]

联系

huan.zhang@qmul.ac.uk

搜集汇总
数据集介绍
main_image_url
构建方式
NeuroPiano数据集由索尼计算机科学实验室东京分部和伦敦玛丽女王大学数字音乐中心联合构建,收录了104段高级学生钢琴演奏的音频记录,涵盖六种标准技术练习。每段录音均由45位专业钢琴家进行标注,提供12个关于演奏质量的多维度问题答案,包括速度、力度和发音等。标注者不仅提供文本反馈,还使用6点量表进行评分。数据集包含2255个音频-问题-答案三元组,其中部分三元组由多位标注者共同完成,以确保标注一致性。
使用方法
NeuroPiano数据集适用于音乐信息检索(MIR)领域的多种研究,如自动演奏评估和个性化音乐教育。研究者可以通过分析音频特征与教师评分之间的关系,开发预测模型以自动化评估演奏质量。同时,文本反馈的分析可以揭示教师评价中的关键概念,为深入理解音乐教学提供依据。数据集的多模态特性使其在机器学习和自然语言处理技术的应用中具有广泛潜力。
背景与挑战
背景概述
NeuroPiano数据集由索尼计算机科学实验室(Sony Computer Science Laboratories)和伦敦玛丽女王大学(Queen Mary University of London)的研究团队共同创建,旨在通过104个学生钢琴演奏录音及2255条专业钢琴家的文本反馈和评分,深入研究音乐信息检索(MIR)在音乐教育中的应用。该数据集的核心研究问题在于标准化注释和注释者间的一致性,以及音频特征与教师评分之间的关系。通过分析这些数据,研究团队希望揭示MIR技术在个性化学习和自动化反馈机制中的潜力,特别是在乐器表演的细微表达方面。
当前挑战
NeuroPiano数据集在构建过程中面临多项挑战。首先,注释者间的一致性问题尤为突出,特别是在动态和连奏等维度上,仅有50%的数据达到一致。其次,预测教师评分时,某些问题如动态变化和连奏的预测效果未能超越随机猜测基线,显示了音频特征与评分之间关系的复杂性。此外,数据集的注释标准化和多模态数据(音频、文本和评分)的整合分析也是一大挑战。这些挑战不仅反映了音乐教育中自动化评估的复杂性,也为未来的研究提供了丰富的探索方向。
常用场景
经典使用场景
NeuroPiano数据集的经典使用场景主要集中在音乐信息检索(MIR)领域,特别是在钢琴演奏评估和音乐教育个性化反馈系统中。该数据集通过整合104段学生钢琴演奏录音、2255条专业钢琴教师的文本反馈及评分,为研究者提供了丰富的多模态数据。这些数据被广泛用于探索音频特征与教师评分之间的关系,通过机器学习模型预测教师评分,从而实现自动化音乐表现评估。此外,数据集中的文本反馈也被用于情感分析和概念标注,以揭示教师对学生演奏的详细评价和指导意见。
解决学术问题
NeuroPiano数据集解决了音乐信息检索领域中关于音乐表现评估的多个学术问题。首先,它通过标准化注释和跨注释者的一致性分析,解决了评估标准不一致的问题。其次,通过探索音频特征与教师评分之间的关系,数据集为构建客观、一致的评估模型提供了基础。此外,数据集中的文本反馈分析有助于深入理解教师评价的语义和情感,从而推动情感分析和自然语言处理技术在音乐教育中的应用。这些研究不仅提升了音乐教育的个性化和自动化水平,还为音乐表现评估的科学化提供了新的视角。
实际应用
在实际应用中,NeuroPiano数据集为音乐教育领域提供了强大的支持。首先,它可以用于开发智能音乐教学系统,通过分析学生的演奏录音和教师的反馈,提供个性化的学习建议和实时反馈。其次,数据集的音频和文本数据可以用于训练自动评分系统,帮助教师减轻评估负担,提高评估的客观性和一致性。此外,通过对教师反馈的情感分析,系统可以生成更具针对性的教学指导,帮助学生改进演奏技巧和表现力。这些应用不仅提升了音乐教学的效率和效果,还为音乐教育的数字化转型提供了新的工具和方法。
数据集最近研究
最新研究方向
在音乐信息检索(MIR)领域,NeuroPiano数据集的最新研究方向主要集中在通过机器学习技术分析学生钢琴演奏的音频特征与教师评分之间的关系。研究者们致力于通过提取音频特征和符号特征,如MFCC、chroma、onset envelope等,以及通过音符转录和计算音符间差异,来预测教师的评分。此外,研究还涉及文本反馈的情感分析,利用BERT模型计算教师评分的情感一致性,并使用GPT-4o进行概念标注,以揭示教师反馈中的关键概念。这些研究不仅提升了对音乐表演质量评估的客观性和一致性,还为个性化音乐教育提供了新的技术支持。
相关研究论文
  • 1
    How does the teacher rate? Observations from the NeuroPiano dataset伦敦玛丽女王大学数字音乐中心,索尼计算机科学实验室东京分部 · 2024年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作