ccmusic-database/acapella|音乐评估数据集|音频分析数据集
收藏数据集概述
数据集名称
- 名称: Acapella Evaluation Dataset
- 别名: Acapella Evaluation
数据集详细描述
- 内容: 包含六首普通话流行歌曲的片段,由22位歌手演唱,共计132个音频片段。每个片段包括一段诗句和一段合唱。
- 评估: 由来自中国音乐学院的四位评委对演唱进行九个维度的评估:音高、节奏、音域、音色、发音、颤音、动态、呼吸控制和整体表现,使用10分制评分。
- 格式: 音频文件为.wav格式,评估记录为.xls格式的Excel表格。
数据集结构
- 音频: 采样率为22,050 Hz的音频文件。
- 评估表格: 包含歌手ID、九个评估维度的分数及整体表现分数。
- 数据字段: 歌曲、歌手ID、音高、节奏、音域、音色、发音、颤音、动态、呼吸控制和整体表现。
数据集用途
- 任务: 声乐分析、回归分析的歌唱评分。
- 适用性: 适用于声乐评估和评分系统的训练数据集。
数据集维护与使用
- 维护: 通过Git LFS进行管理。
- 使用示例: 使用
datasets
库加载数据集,并按歌曲分段处理数据。
数据集创建
- 采集与标注: 由22位歌手演唱的132个音频片段,由四位评委进行评估。
- 标注者: 来自中国音乐学院的评委。
- 数据保护: 隐藏了歌手和评委的姓名。
数据集限制
- 语言限制: 仅包含普通话歌曲。
- 数据标记: 未标记声乐的起点。
许可证
- 类型: MIT License
- 版权持有者: CCMUSIC
引用信息
bibtex @dataset{zhaorui_liu_2021_5676893, author = {Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li and Baoqiang Han}, title = {CCMusic: an Open and Diverse Database for Chinese and General Music Information Retrieval Research}, month = {mar}, year = {2024}, publisher = {HuggingFace}, version = {1.2}, url = {https://huggingface.co/ccmusic-database} }

THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Cultural Dimensions Dataset
该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。
geerthofstede.com 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录