five

IdolSongsJp

收藏
arXiv2025-07-02 更新2025-07-04 收录
下载链接:
https://huggingface.co/datasets/imprt/idol-songs-jp
下载链接
链接失效反馈
官方服务:
资源简介:
IdolSongsJp 数据集是一个包含15首多歌手歌曲的数据集,这些歌曲的风格类似于日本偶像团体。该数据集由专业作曲家创作,包含15首歌曲,10名女歌手和8名男歌手。歌曲包含多种音乐风格和歌词主题,并具有高音量、真实的歌曲分割结构(utawari)和多样化的和弦进行。数据集还包括音乐源分离的 stems、干声轨道和弦标注,适合评估各种音乐信息处理技术,如歌手分割、音乐源分离和自动和弦估计。该数据集可用于非商业研究目的,并在 https://huggingface.co/datasets/imprt/idol-songs-jp 提供免费下载。

The IdolSongsJp dataset is a collection of 15 multi-artist songs stylistically aligned with Japanese idol groups. Developed by professional composers, the dataset features 15 songs performed by 10 female singers and 8 male singers. The songs encompass diverse musical genres and lyrical themes, and exhibit high audio volume, authentic song segmentation structure (utawari), and varied chord progressions. Additionally, the dataset provides music source-separated stems, dry vocal tracks, and chord annotations, making it suitable for evaluating a range of music information processing technologies, including singer diarization, music source separation, and automatic chord estimation. This dataset is available for non-commercial research purposes only, and can be freely downloaded at https://huggingface.co/datasets/imprt/idol-songs-jp.
提供机构:
国家先进工业科学技术研究所 (AIST), 东京, 日本
创建时间:
2025-07-02
搜集汇总
数据集介绍
main_image_url
构建方式
IdolSongsJp数据集的构建过程充分体现了对日本偶像团体音乐风格的深度还原。研究团队邀请了专业作曲家创作了15首具有偶像团体特色的原创曲目,并聘请10名女性和8名男性专业或半专业歌手参与录制。每首歌曲都采用独特的歌手组合,确保风格的多样性。数据采集过程严格遵循专业音乐制作流程,包含分轨录音、总线效果处理、母带制作等环节,最终生成48kHz/32bit浮点格式的音频文件。除完成版音轨外,团队还专门制作了用于音乐源分离的干声音轨、未经限制器处理的母带总线信号,以及专业标注的和弦进行数据。
特点
该数据集最显著的特点是高度还原了日本偶像音乐的复杂特性。所有曲目均采用商业级响度处理(-7LUFS),并包含典型的歌割り结构,即不同歌手在歌曲各段落交替演唱的编排方式。音乐风格涵盖流行、UK Garage、摇滚、舞曲等多种类型,歌词主题除常见的情爱内容外,还包含偶像自我介绍等特色题材。数据集特别收录了现场演出中观众欢呼声的录音,真实模拟了偶像演唱会氛围。技术层面,该资源不仅提供最终混音版本,还包含分轨素材、干声人声、和弦标注等丰富内容,为多维度研究提供了完整的数据支持。
使用方法
该数据集适用于音乐信息检索领域的多项研究任务。在音乐源分离方向,研究者可利用分轨数据评估算法在商业级响度音乐中的表现;和弦识别研究可基于专家标注的和弦进行数据,开发复杂和弦结构的识别模型;人声转录任务则可利用干声轨评估抗伴奏干扰能力。针对偶像音乐特有的多歌手特性,数据集可用于歌手角色分配、音高检测等研究。使用前需注意授权条款,允许非商业用途的研究和娱乐使用,但禁止用于商业用途或训练生成模型。所有音频文件均采用专业级参数保存,建议使用支持32位浮点处理的音频分析工具进行操作。
背景与挑战
背景概述
IdolSongsJp数据集由日本产业技术综合研究所(AIST)、明治大学和东京大学的研究团队于2025年创建,旨在模拟日本偶像团体音乐的多重复杂性。该数据集包含15首专业创作的歌曲,涵盖多样化的音乐风格、和弦进行及声部分配结构(如“歌割り”),并提供了母带级音频、干声轨道、和弦标注等丰富素材。其核心研究问题聚焦于高响度、多歌手场景下的音乐信息检索技术评估,填补了现有数据集在商业级音乐制作特征上的空白,对歌手分离、和弦估计等MIR任务具有重要基准价值。
当前挑战
该数据集面临的挑战主要体现在两方面:领域问题上,需解决高响度母带处理导致的声源分离性能下降(如鼓组和人声分离SDR降低3-5dB)、复杂和弦结构(如七九和弦)的自动识别准确率不足60%等难题;构建过程中,需协调多歌手录音的时序对齐、保持商业级响度(-7LUFS)与动态范围的平衡,并规避采样库版权限制以实现合法开源分发。此外,歌词转录任务中伴奏干扰导致传统ASR模型的字符错误率高达40%,凸显了跨模态处理的挑战性。
常用场景
经典使用场景
IdolSongsJp数据集作为日本偶像团体风格的多歌手歌曲语料库,其经典使用场景主要集中在音乐信息检索(MIR)领域的研究与评估。该数据集通过模拟商业偶像歌曲的高响度、复杂编曲及歌分(utawari)结构,为歌手分离(singer diarization)、音乐源分离(MSS)和自动和弦估计(ACE)等任务提供了标准化测试平台。例如,研究者可利用其分轨干声数据训练模型以识别多歌手交替演唱的时序,或通过包含母带效果的混合音轨评估算法在真实场景下的鲁棒性。
解决学术问题
该数据集有效解决了当代音乐信息处理中的三大核心问题:一是高响度商业音乐中复杂母带效应导致的源分离性能下降问题,通过提供-7 LUFS与-9 LUFS两种响度版本,量化了动态范围压缩对分离精度的影响;二是多歌手歌曲中歌分结构的自动化分析难题,其精确标注的干声轨为歌手识别与音高检测提供了黄金标准;三是扩展和弦词汇的识别挑战,数据集中丰富的七和弦、九和弦等复杂和弦类型推动了算法对非三和弦结构的建模能力。
衍生相关工作
该数据集已催生多项标志性研究:在源分离领域,Hybrid Transformer Demucs模型通过其分轨数据验证了母带效应导致的性能边界;在歌手识别方向,Suda等人提出的基于歌分结构的无监督聚类算法将多歌手场景下的F1-score提升至0.82;和弦估计方面,Park团队的Bi-directional Transformer模型首次在包含扩展和弦的测试集上实现超过60%的准确率。这些工作共同推动了针对高复杂度流行音乐的算法范式革新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作