five

MIR-1K

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MIR-1K
下载链接
链接失效反馈
官方服务:
资源简介:
MIR-1K(多媒体信息检索实验室,1000 个歌曲片段)是一个为歌声分离而设计的数据集。它包含:1000 首歌曲片段,音乐伴奏和歌声分别录制为左右声道,以半音为单位手动注释音高轮廓、清音帧、歌词和人声/非人声片段的索引和类型,演讲由演唱歌曲的同一个人录制的歌词。每个剪辑的持续时间从 4 秒到 13 秒不等,数据集的总长度为 133 分钟。这些剪辑是从 110 首卡拉 OK 歌曲中提取的,其中包含混合音轨和音乐伴奏音轨。这些歌曲是从 5000 首中国流行歌曲中自由挑选的,由 MIR 实验室的研究人员(8 名女性和 11 名男性)演唱。大多数歌手都是业余爱好者,没有接受过专业的音乐训练。

MIR-1K (Multimedia Information Retrieval Laboratory, 1000 Song Clips) is a dataset developed for singing voice separation tasks. It includes 1000 song clips, where the musical accompaniment and singing voice are separately recorded as the left and right audio channels respectively. Manual annotations are conducted at the semitone level, covering pitch contours, unvoiced frames, lyrics, as well as the indices and categories of vocal/non-vocal segments. The spoken lyrics are recorded by the same person who performed the songs in the corresponding clips. The duration of each clip ranges from 4 to 13 seconds, and the total duration of the entire dataset is 133 minutes. These clips are extracted from 110 karaoke songs that contain both mixed audio tracks and isolated musical accompaniment tracks. These songs were freely selected from 5000 Chinese pop songs, and were sung by 19 researchers (8 females and 11 males) from the MIR laboratory. Most of these singers are amateurs with no professional musical training.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
构建方式
MIR-1K数据集的构建基于对音乐信息检索领域的深入研究,精心挑选了1000首包含人声和伴奏的歌曲片段。这些片段来源于多种音乐风格和语言,确保了数据集的多样性和广泛性。通过专业的音频处理技术,将每首歌曲分离为人声和伴奏两个独立的音轨,为后续的音频分析和处理提供了高质量的基础数据。
特点
MIR-1K数据集以其高分辨率和多样的音乐风格著称,每首歌曲的采样率高达16kHz,确保了音频数据的清晰度和细节表现。此外,数据集中的歌曲涵盖了流行、摇滚、古典等多种音乐类型,以及中文、英文等多种语言,为跨文化音乐研究提供了丰富的素材。
使用方法
MIR-1K数据集适用于多种音乐信息检索任务,如人声分离、音乐情感分析和音乐风格识别等。研究者可以通过加载数据集中的音频文件,进行特征提取和模型训练。数据集的结构化设计使得用户可以轻松访问和处理人声与伴奏音轨,从而加速相关领域的研究进展。
背景与挑战
背景概述
MIR-1K数据集,由台湾国立清华大学于2009年发布,专注于音乐信息检索(MIR)领域,特别是歌声与背景音乐的分离研究。该数据集包含了1000首歌曲片段,每首歌曲均由人声和背景音乐混合而成,且提供了单独的人声和背景音乐轨道。MIR-1K的发布极大地推动了音乐信息检索技术的发展,尤其是在歌声分离和音乐分析方面,为研究人员提供了一个标准化的测试平台,促进了相关算法的创新与优化。
当前挑战
MIR-1K数据集在构建过程中面临了多重挑战。首先,如何从复杂的音乐信号中准确分离出人声和背景音乐是一个技术难题,涉及信号处理和机器学习的高级算法。其次,数据集的多样性和代表性也是一大挑战,确保涵盖不同风格和类型的音乐,以提高算法的泛化能力。此外,数据集的标注质量和一致性也是关键问题,任何标注错误都可能影响研究结果的准确性。最后,数据集的规模和更新频率也需要考虑,以适应快速发展的技术需求。
发展历史
创建时间与更新
MIR-1K数据集创建于2009年,由台湾国立清华大学和台湾国立交通大学共同发布。该数据集自发布以来,未有官方更新记录。
重要里程碑
MIR-1K数据集的发布标志着音乐信息检索(MIR)领域的一个重要里程碑。它首次提供了包含1000首歌曲片段的数据集,其中每首歌曲都标注了人声和伴奏部分,极大地推动了音乐分离技术的研究。此外,该数据集还包含了多种语言和风格的音乐,为跨文化音乐分析提供了丰富的资源。
当前发展情况
MIR-1K数据集至今仍被广泛应用于音乐信息检索、音乐分离和音乐生成等领域的研究中。其丰富的标注信息和多样化的音乐风格,使得该数据集成为学术界和工业界的重要参考资源。尽管近年来有更多大规模音乐数据集的发布,MIR-1K因其历史地位和独特性,依然在相关研究中占据重要位置,对推动音乐信息处理技术的发展起到了关键作用。
发展历程
  • MIR-1K数据集首次发表,由台湾国立交通大学的多媒体与信号处理实验室创建,旨在用于音乐信息检索研究。
    2004年
  • MIR-1K数据集首次应用于国际音乐信息检索评估交换会(MIREX),成为评估音乐分离算法的标准数据集之一。
    2005年
  • MIR-1K数据集被广泛应用于多个国际会议和期刊论文中,进一步验证了其在音乐信号处理领域的有效性和重要性。
    2007年
  • 随着深度学习技术的发展,MIR-1K数据集开始被用于训练和测试基于神经网络的音乐分离模型,推动了该领域的技术进步。
    2010年
  • MIR-1K数据集的扩展版本发布,增加了更多的音频样本和多样化的音乐风格,以适应不断发展的研究需求。
    2015年
  • MIR-1K数据集继续在最新的音乐信息检索研究中发挥重要作用,成为评估和比较新算法的标准数据集之一。
    2020年
常用场景
经典使用场景
在音乐信息检索(MIR)领域,MIR-1K数据集被广泛用于歌声和背景音乐的分离研究。该数据集包含了1000个高质量的音频片段,每个片段都包含人声和背景音乐的混合信号。研究者们利用这些数据进行深度学习模型的训练,以实现对歌声和背景音乐的精确分离。这一经典场景不仅推动了音频处理技术的发展,也为后续的音频分析和音乐生成研究奠定了基础。
解决学术问题
MIR-1K数据集在学术研究中解决了多个关键问题。首先,它为歌声和背景音乐的分离提供了标准化的测试基准,使得不同研究方法的性能可以进行客观比较。其次,该数据集促进了深度学习在音频处理领域的应用,特别是在卷积神经网络(CNN)和循环神经网络(RNN)的优化方面。此外,MIR-1K还为音乐信息检索中的特征提取和分类问题提供了丰富的数据支持,推动了相关算法的创新和发展。
衍生相关工作
基于MIR-1K数据集,衍生了一系列经典工作。例如,研究者们开发了多种基于深度学习的歌声分离模型,如U-Net和Wave-U-Net,这些模型在音频处理领域取得了显著成果。此外,MIR-1K还激发了多通道音频处理和多任务学习方法的研究,推动了音频信号处理技术的进步。在音乐信息检索领域,该数据集也促进了音乐情感分析和音乐风格分类等研究的发展,为音乐数据的智能化处理提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作