five

ismir2022-datasets

收藏
github2022-12-12 更新2024-05-31 收录
下载链接:
https://github.com/otnemrasordep/ismir2022-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
ISMIR 2022会议上介绍的音乐信息检索数据集论文列表,包含27篇论文及其相关数据集的详细信息。

A list of papers presented at the ISMIR 2022 conference on music information retrieval datasets, including detailed information on 27 papers and their associated datasets.
创建时间:
2022-12-09
原始信息汇总

数据集概述

1. Interpreting Song Lyrics with an Audio-Informed Pre-trained Language Model

  • 数据集链接: https://zenodo.org/record/7019124
  • 标签: #audio-music #lyrics #dataset

2. Scaling Polyphonic Transcription with Mixtures of Monophonic Transcriptions

  • 数据集链接: https://github.com/magenta/mt3
  • 标签: #symbolic-music/transcription #dataset

3. YM2413-MDB: A Multi-Instrumental FM Video Game Music Dataset with Emotion Annotations

  • 数据集链接: https://github.com/jech2/YM2413-MDB
  • 标签: #symbolic-music/emotion #dataset

4. AccoMontage2: A Complete Harmonization and Accompaniment Arrangement System

  • 数据集链接: https://github.com/billyblu2000/accomontage2
  • 标签: #symbolic-music/generation #dataset

5. Playing Technique Detection by Fusing Note Onset Information in Guzheng Performance

  • 数据集链接: https://ccmusic-database.github.io/en/database/ccm.html#GZTech
  • 标签: #dataset

6. KDC: an open corpus for computational research of dastgāhi music

  • 数据集链接: https://phaidra.kug.ac.at/view/o:127195
  • 标签: #dataset

7. Automatic Chinese National Pentatonic Modes Recognition Using Convolutional Neural Network

  • 数据集链接: https://ccmusic-database.github.io/en/database/ccm.html
  • 标签: #dataset

8. Teach Yourself Georgian Folk Songs Dataset: A Annotated Corpus Of Traditional Vocal Polyphony

  • 数据集链接: upon request
  • 标签: #dataset

9. A Dataset for Greek Traditional and Folk Music: Lyra

  • 数据集链接: https://github.com/pxaris/lyra-dataset
  • 标签: #dataset

10. Analysis and detection of singing techniques in repertoires of J-POP solo singers

  • 数据集链接: https://yamathcy.github.io/ISMIR2022J-POP/
  • 标签: #dataset

11. ATEPP: A Dataset of Automatically Transcribed Expressive Piano Performance

  • 数据集链接: https://zenodo.org/record/6564406#.Y5QnkezP3OQ
  • 标签: #symbolic-music/MIDI #symbolic-music/musicXML #symbolic-music/classification #dataset

12. Parameter Sensitivity of Deep-Feature based Evaluation Metrics for Audio Textures

  • 数据集链接: https://animatedsound.com/ismir2022/metrics/
  • 标签: #dataset

13. Multi-pitch Estimation meets Microphone Mismatch: Applicability of Domain Adaptation

  • 数据集链接: https://www.idmt.fraunhofer.de/en/publications/datasets/piano-mm.html
  • 标签: #dataset

14. Melody transcription via generative pre-training

  • 数据集链接: https://github.com/chrisdonahue/sheetsage
  • 标签: #dataset

15. A Dataset of Symbolic Texture Annotations in Mozart Piano Sonatas

  • 数据集链接: https://gitlab.com/algomus.fr/algomus-data/tree/master/quartets/mozart
  • 标签: #symbolic-music #dataset

16. Violin Etudes: A Comprehensive Dataset for f0 Estimation and Performance Analysis

  • 数据集链接: https://zenodo.org/record/6564408#.Y5Mj1OzP3OQ
  • 标签: #dataset

17. Symphony Generation with Permutation Invariant Language Model

  • 数据集链接: https://symphonynet.github.io/
  • 标签: #symbolic-music/generation #dataset

18. Towards robust music source separation on loud commercial music

  • 数据集链接: https://github.com/jeonchangbin49/musdb-XL https://github.com/jeonchangbin49/LimitAug
  • 标签: #dataset

19. Towards Quantifying the Strength of Music Scenes Using Live Event Data

  • 数据集链接: https://github.com/JimiLab/LocalifyMusicEventData
  • 标签: #dataset

20. Improving Choral Music Separation through Expressive Synthesized Data from Sampled Instruments

  • 数据集链接: https://github.com/RetroCirce/Choral_Music_Separation
  • 标签: #audio-music/source-separation #dataset

21. Emotion-driven Harmonisation And Tempo Arrangement of Melodies Using Transfer Learning

  • 数据集链接: http://coconuts-palm-lab.com/EH/HED.zip
  • 标签: #symbolic-music/generation #symbolic-music/emotion #dataset

22. EnsembleSet: a new high quality synthesised dataset for chamber ensemble separation

  • 数据集链接: https://zenodo.org/record/6519024#.Y5QppuzP3OQ
  • 标签: #audio-music/source-separation #symbolic-music/transcription #dataset

23. MusAV: A dataset of relative arousal-valence annotations for validation of audio models

  • 数据集链接: https://mtg.github.io/musav-dataset/
  • 标签: #audio-music/emotion #dataset

24. Robust Melody Track Identification in Symbolic Music

  • 数据集链接: https://github.com/maxichu/MelodyTrackIdentification
  • 标签: #symbolic-music/MIDI #dataset

25. Tracking the Evolution of a Bands Live Performances over Decades

  • 数据集链接: https://github.com/grateful-dead-live/fifteen-songs-dataset
  • 标签: #dataset

26. A Novel Dataset and Deep Learning Benchmark for Classical Music Form Recognition and Analysis

  • 数据集链接: https://github.com/danielathome19/Form-NN
  • 标签: #symbolic-music/MIDI #dataset

27. BAF: An audio fingerprinting dataset for broadcast monitoring

  • 数据集链接: https://zenodo.org/record/6868083#.Y5MhaOzP3OQ
  • 标签: #audio-music/fingerprinting #dataset
搜集汇总
数据集介绍
main_image_url
构建方式
ismir2022-datasets 数据集汇集了在 ISMIR 2022 会议上展示的 27 篇论文所引入的音乐信息检索(MIR)相关数据集。这些数据集涵盖了从音频音乐到符号音乐的多个领域,包括歌词分析、情感标注、多音轨转录、音乐生成等。每个数据集均通过论文的形式详细描述了其构建过程,数据来源多样,包括公开的音乐数据库、合成数据以及通过特定实验生成的数据。数据集的构建通常结合了领域专家的标注和自动化工具的处理,确保了数据的多样性和高质量。
特点
ismir2022-datasets 的特点在于其广泛的应用场景和多样化的数据类型。数据集不仅涵盖了传统的音频和符号音乐数据,还包含了情感标注、演奏技巧检测、音乐风格识别等高级任务所需的数据。部分数据集还提供了多模态数据,如音频与歌词的结合,或是符号音乐与情感标签的配对。这些数据集的设计充分考虑了音乐信息检索领域的前沿需求,能够支持从基础研究到复杂应用的多种任务。此外,数据集的开放性和可访问性也为全球研究者提供了宝贵的资源。
使用方法
ismir2022-datasets 的使用方法因具体数据集而异,但通常包括数据下载、预处理和模型训练三个主要步骤。用户可以通过论文中提供的链接访问数据集,部分数据集托管在 Zenodo、GitHub 等平台,部分则需要通过邮件申请获取。数据预处理可能涉及音频特征提取、符号音乐格式转换或情感标签的标准化处理。在模型训练阶段,研究者可以根据任务需求选择合适的算法,如深度学习模型或传统机器学习方法。数据集的多样性使得其适用于音乐生成、情感分析、演奏技巧检测等多种任务,为音乐信息检索领域的研究提供了坚实的基础。
背景与挑战
背景概述
ismir2022-datasets是由国际音乐信息检索协会(ISMIR)在2022年会议上发布的一系列数据集集合,涵盖了音乐信息检索领域的多个研究方向。这些数据集由全球多个研究团队贡献,旨在推动音乐信息检索技术的进步。数据集涉及的主题广泛,包括歌词解释、多音轨转录、情感标注、音乐生成、演奏技巧检测等。这些数据集的发布不仅为音乐信息检索领域的研究者提供了丰富的实验材料,还促进了跨学科的合作与创新。通过公开这些数据集,研究人员能够更好地理解和分析音乐的结构、情感表达以及演奏技巧,从而推动音乐信息检索技术的进一步发展。
当前挑战
ismir2022-datasets在构建和应用过程中面临多重挑战。首先,音乐数据的多样性和复杂性使得数据集的标注和标准化变得尤为困难,尤其是在多音轨转录和情感标注等任务中,如何确保数据的准确性和一致性是一个重要问题。其次,音乐数据的版权和隐私问题也对数据集的公开和使用提出了挑战,部分数据集由于涉及版权限制,只能通过申请获取。此外,音乐信息检索领域的跨学科特性要求数据集能够支持多种研究任务,如音频分析、符号音乐处理等,这对数据集的多样性和通用性提出了更高要求。最后,如何有效利用这些数据集进行模型训练和评估,尤其是在深度学习模型的背景下,仍然是一个亟待解决的问题。
常用场景
经典使用场景
在音乐信息检索(MIR)领域,ismir2022-datasets为研究者提供了丰富的多模态音乐数据,涵盖了从歌词解释、情感标注到音乐生成等多个方面。这些数据集广泛应用于音乐转录、情感分析、音乐生成等任务,为音乐信息检索的研究提供了坚实的基础。
衍生相关工作
ismir2022-datasets催生了多项经典研究工作,如基于音频信息的预训练语言模型用于歌词解释、多音轨转录的混合模型、以及基于情感标注的音乐生成系统。这些研究不仅推动了音乐信息检索领域的技术进步,还为跨学科研究提供了新的思路和方法,进一步拓展了音乐与人工智能的结合领域。
数据集最近研究
最新研究方向
近年来,音乐信息检索(MIR)领域的研究逐渐聚焦于多模态数据的融合与深度学习的应用。ismir2022-datasets展示了多个前沿研究方向,包括基于音频信息的歌词理解、多音轨转录的扩展、情感标注的音乐数据集构建等。特别是在情感分析与音乐生成方面,数据集如YM2413-MDB和AccoMontage2为研究者提供了丰富的资源,推动了音乐情感计算与自动伴奏系统的创新。此外,音乐源分离技术的进步,如EnsembleSet和Choral_Music_Separation,为复杂音乐场景下的信号处理提供了新的解决方案。这些数据集不仅促进了MIR领域的技术突破,也为跨学科研究提供了重要的数据支持,进一步推动了音乐与人工智能的深度融合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作