five

MIR-1K

收藏
魔搭社区2025-12-04 更新2025-03-01 收录
下载链接:
https://modelscope.cn/datasets/OpenDataLab/MIR-1K
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: MIR-1K labelTypes: - Multi-label Classification - Meter&Lyrics Annotation license: - Unknown mediaTypes: - Audio paperUrl: "" publishDate: "2010" publishUrl: http://mirlab.org/dataset/public/ publisher: - National Taiwan University tags: - Song taskTypes: - Audio Source Separation --- # 数据集介绍 ## 简介 MIR-1K(多媒体信息检索实验室,1000 个歌曲片段)是一个为歌声分离而设计的数据集。它包含:1000 首歌曲片段,音乐伴奏和歌声分别录制为左右声道,以半音为单位手动注释音高轮廓、清音帧、歌词和人声/非人声片段的索引和类型,演讲由演唱歌曲的同一个人录制的歌词。每个剪辑的持续时间从 4 秒到 13 秒不等,数据集的总长度为 133 分钟。这些剪辑是从 110 首卡拉 OK 歌曲中提取的,其中包含混合音轨和音乐伴奏音轨。这些歌曲是从 5000 首中国流行歌曲中自由挑选的,由 MIR 实验室的研究人员(8 名女性和 11 名男性)演唱。大多数歌手都是业余爱好者,没有接受过专业的音乐训练。 ## 引文 ``` @article{hsu2009improvement, title={On the improvement of singing voice separation for monaural recordings using the MIR-1K dataset}, author={Hsu, Chao-Ling and Jang, Jyh-Shing Roger}, journal={IEEE transactions on audio, speech, and language processing}, volume={18}, number={2}, pages={310--319}, year={2009}, publisher={IEEE} } ``` ## Download dataset :modelscope-code[]{type="git"}

显示名称:MIR-1K 标签类型: - 多标签分类(Multi-label Classification) - 节拍与歌词注释(Meter&Lyrics Annotation) 许可协议: - 未知 媒体类型: - 音频 论文链接:无 发布日期:2010年 发布地址:http://mirlab.org/dataset/public/ 发布方: - 台湾大学 标签: - 歌曲 任务类型: - 音频源分离(Audio Source Separation) --- # 数据集介绍 ## 简介 MIR-1K(多媒体信息检索实验室1000首歌曲片段数据集)是专为歌声分离任务打造的数据集。其包含1000首歌曲片段:音乐伴奏与人声分别录制为左右声道,以半音为单位对音高轮廓、清音帧、歌词以及人声/非人声片段的索引与类别进行人工标注,同时附带由演唱者本人录制的歌词语音素材。每个音频片段的时长介于4秒至13秒之间,数据集总时长达133分钟。该数据集的音频片段源自110首卡拉OK歌曲,每首歌曲均包含混合音轨与纯伴奏音轨;这些歌曲均从5000首华语流行歌曲中自由遴选,由MIR实验室的研究人员(8名女性、11名男性)演唱,其中绝大多数演唱者为未接受过专业音乐训练的业余爱好者。 ## 引文 @article{hsu2009improvement, title={On the improvement of singing voice separation for monaural recordings using the MIR-1K dataset}, author={Hsu, Chao-Ling and Jang, Jyh-Shing Roger}, journal={IEEE transactions on audio, speech, and language processing}, volume={18}, number={2}, pages={310--319}, year={2009}, publisher={IEEE} } ## 下载数据集 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-08
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MIR-1K是一个专为人声分离设计的数据集,包含1000个4至13秒的歌曲片段,总时长为133分钟。这些片段来自110首卡拉OK歌曲,包括混合音轨和伴奏音轨,由19名业余歌手演唱,并附有人工标注的音高轮廓、歌词等信息。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作