ccmusic-database/song_structure
收藏Hugging Face2024-07-14 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/ccmusic-database/song_structure
下载链接
链接失效反馈官方服务:
资源简介:
Song Structure Annotation Database数据集包含300首流行歌曲的.mp3文件,每首歌曲都附带一个.txt格式的结构注释文件。注释由来自中国音乐学院的专业音乐家和教师完成。数据集中的歌曲包括208首中文歌曲、87首英文歌曲、3首韩文歌曲和2首日文歌曲。歌曲结构标签包括intro、re-intro、verse、chorus、pre-chorus、post-chorus、bridge、interlude和ending。数据集未经过频谱图转换等预处理,提供了原始内容。数据集的组织基于音频文件,每个项目分为三列:第一列是22,050 Hz采样的.mp3格式音频,第二列是标记不同歌曲部分边界的时间点列表,第三列是与第二列中列出的歌曲结构标签对应的列表。数据集支持时间序列预测任务,主要用于促进AI音乐行业的发展。
Song Structure Annotation Database数据集包含300首流行歌曲的.mp3文件,每首歌曲都附带一个.txt格式的结构注释文件。注释由来自中国音乐学院的专业音乐家和教师完成。数据集中的歌曲包括208首中文歌曲、87首英文歌曲、3首韩文歌曲和2首日文歌曲。歌曲结构标签包括intro、re-intro、verse、chorus、pre-chorus、post-chorus、bridge、interlude和ending。数据集未经过频谱图转换等预处理,提供了原始内容。数据集的组织基于音频文件,每个项目分为三列:第一列是22,050 Hz采样的.mp3格式音频,第二列是标记不同歌曲部分边界的时间点列表,第三列是与第二列中列出的歌曲结构标签对应的列表。数据集支持时间序列预测任务,主要用于促进AI音乐行业的发展。
提供机构:
ccmusic-database
原始信息汇总
数据集概述
数据集名称
- 名称: Song Structure Annotation Database
- 别名: Song Structure
数据集内容
- 类型: 时间序列预测
- 语言: 中文, 英文
- 标签: 音乐, 艺术
- 数据格式: .mp3, .txt
- 数据量: 小于1000条
数据集详情
- 原始数据: 包含300首流行歌曲的.mp3文件,来源于网易云音乐,每首歌曲附带一个.txt格式的结构标注文件。
- 标注者: 来自中国音乐学院的专业音乐家和教师。
- 歌曲结构标签: intro, re-intro, verse, chorus, pre-chorus, post-chorus, bridge, interlude, ending。
- 统计信息: 208首中文歌曲,87首英文歌曲,3首韩文歌曲,2首日文歌曲。
- 最常见标签: chorus和verse。
- 最少见标签: post-chorus,仅2个。
数据集结构
- 音频文件: 以.mp3格式提供,采样率为22,050 Hz。
- 标注文件: 包含歌曲各部分的时间点和对应的结构标签。
数据集使用
- 加载示例: python from datasets import load_dataset dataset = load_dataset("ccmusic-database/song_structure")
数据集创建
- 采集与标注: 由CCMUSIC的学生收集和标注300首流行歌曲及其结构。
- 版权考虑: 由于版权问题,仅提供音频的特征数据。
许可证
- 许可证: MIT License
引用信息
bibtex @dataset{zhaorui_liu_2021_5676893, author = {Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li and Baoqiang Han}, title = {CCMusic: an Open and Diverse Database for Chinese and General Music Information Retrieval Research}, month = {mar}, year = {2024}, publisher = {HuggingFace}, version = {1.2}, url = {https://huggingface.co/ccmusic-database} }
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含300首中英文流行歌曲的原始音频及专业标注的结构信息,主要用于音乐结构分析的时间序列预测任务。数据集以未处理的原始音频为主,但受版权限制仅提供特征数据,且中文歌曲占多数。
以上内容由遇见数据集搜集并总结生成



