five

Chinese Pop Song Lyric-Melody Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://lichaiustc.github.io/CSL-L2M/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个高质量、精确标注的平行歌词旋律数据集,包含10,170首中文流行歌曲,并附有音乐标签,如调性、歌词情感、歌曲结构和每分钟节拍数(BPM)。此外,该数据集被划分为训练集、验证集和测试集,比例分别为9:0.5:0.5,其中包含了关于音高/MIDI编号、音符长度和对齐类型的详细统计信息。规模达到10,170首歌曲,任务旨在进行歌词到旋律的生成。

This dataset is a high-quality, precisely annotated parallel lyrics-melody dataset consisting of 10,170 Chinese pop songs, with supplementary musical tags covering tonality, lyric sentiment, song structure, and beats per minute (BPM). Additionally, the dataset is divided into training, validation, and test subsets at a ratio of 9:0.5:0.5, and contains detailed statistical data on pitch/MIDI numbers, note lengths, and alignment types. The core downstream task of this dataset is lyrics-to-melody generation.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CSL-L2M是一个专注于中文流行歌曲歌词到旋律生成的数据集,包含10170首4/4拍的中文流行歌曲。该数据集支持可控的歌曲级旋律生成,通过细粒度的歌词和音乐控制(如音节、句子级对齐、词性、音调嵌入以及音乐标签和统计属性),实现了高质量、结构化且用户可定制的旋律生成。实验表明,该方法在生成质量、可控性和结构方面优于现有技术。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作