MIR-1K
收藏魔搭社区2025-12-04 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/MIR-1K
下载链接
链接失效反馈官方服务:
资源简介:
displayName: MIR-1K
labelTypes:
- Multi-label Classification
- Meter&Lyrics Annotation
license:
- Unknown
mediaTypes:
- Audio
paperUrl: ""
publishDate: "2010"
publishUrl: http://mirlab.org/dataset/public/
publisher:
- National Taiwan University
tags:
- Song
taskTypes:
- Audio Source Separation
---
# 数据集介绍
## 简介
MIR-1K(多媒体信息检索实验室,1000 个歌曲片段)是一个为歌声分离而设计的数据集。它包含:1000 首歌曲片段,音乐伴奏和歌声分别录制为左右声道,以半音为单位手动注释音高轮廓、清音帧、歌词和人声/非人声片段的索引和类型,演讲由演唱歌曲的同一个人录制的歌词。每个剪辑的持续时间从 4 秒到 13 秒不等,数据集的总长度为 133 分钟。这些剪辑是从 110 首卡拉 OK 歌曲中提取的,其中包含混合音轨和音乐伴奏音轨。这些歌曲是从 5000 首中国流行歌曲中自由挑选的,由 MIR 实验室的研究人员(8 名女性和 11 名男性)演唱。大多数歌手都是业余爱好者,没有接受过专业的音乐训练。
## 引文
```
@article{hsu2009improvement,
title={On the improvement of singing voice separation for monaural recordings using the MIR-1K dataset},
author={Hsu, Chao-Ling and Jang, Jyh-Shing Roger},
journal={IEEE transactions on audio, speech, and language processing},
volume={18},
number={2},
pages={310--319},
year={2009},
publisher={IEEE}
}
```
## Download dataset
:modelscope-code[]{type="git"}
显示名称:MIR-1K
标签类型:
- 多标签分类(Multi-label Classification)
- 节拍与歌词注释(Meter&Lyrics Annotation)
许可协议:
- 未知
媒体类型:
- 音频
论文链接:无
发布日期:2010年
发布地址:http://mirlab.org/dataset/public/
发布方:
- 台湾大学
标签:
- 歌曲
任务类型:
- 音频源分离(Audio Source Separation)
---
# 数据集介绍
## 简介
MIR-1K(多媒体信息检索实验室1000首歌曲片段数据集)是专为歌声分离任务打造的数据集。其包含1000首歌曲片段:音乐伴奏与人声分别录制为左右声道,以半音为单位对音高轮廓、清音帧、歌词以及人声/非人声片段的索引与类别进行人工标注,同时附带由演唱者本人录制的歌词语音素材。每个音频片段的时长介于4秒至13秒之间,数据集总时长达133分钟。该数据集的音频片段源自110首卡拉OK歌曲,每首歌曲均包含混合音轨与纯伴奏音轨;这些歌曲均从5000首华语流行歌曲中自由遴选,由MIR实验室的研究人员(8名女性、11名男性)演唱,其中绝大多数演唱者为未接受过专业音乐训练的业余爱好者。
## 引文
@article{hsu2009improvement,
title={On the improvement of singing voice separation for monaural recordings using the MIR-1K dataset},
author={Hsu, Chao-Ling and Jang, Jyh-Shing Roger},
journal={IEEE transactions on audio, speech, and language processing},
volume={18},
number={2},
pages={310--319},
year={2009},
publisher={IEEE}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-08
搜集汇总
数据集介绍

背景与挑战
背景概述
MIR-1K是一个专为人声分离设计的数据集,包含1000个4至13秒的歌曲片段,总时长为133分钟。这些片段来自110首卡拉OK歌曲,包括混合音轨和伴奏音轨,由19名业余歌手演唱,并附有人工标注的音高轮廓、歌词等信息。
以上内容由遇见数据集搜集并总结生成



