Music-Health-Dataset
收藏github2020-01-23 更新2024-05-31 收录
下载链接:
https://github.com/DennyHsieh/music-health-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与歌曲相关的详细信息,如歌曲ID、名称、艺术家、发行年份等,并用于生理测量研究。数据集中的歌曲由深度学习进行注释,且计划将文件格式从.xlsx转换为.csv。
This dataset encompasses detailed information related to songs, such as song ID, name, artist, release year, etc., and is utilized for physiological measurement research. The songs within the dataset are annotated through deep learning, and there are plans to convert the file format from .xlsx to .csv.
创建时间:
2018-04-24
原始信息汇总
数据集概述
数据集名称
- Music-Health-Dataset
数据集描述
- 包含与歌曲相关的数据表,这些歌曲通过深度学习进行标注,并用于生理测量。
- 文件格式将从.xlsx转换为.csv。
数据集结构
表列表
-
song_basicinfo
- 包含歌曲的基本信息。
- 主要字段:song_id, song_id_kkbox, song_name, song_artist, song_original_artist, song_year。
-
song_path
- 包含歌曲的路径信息。
- 主要字段:song_id, song_lyric, song_file, youtube_link, youtube_date, youtube_lastretrieve_date, kkbox_lastretrieve_date, song_album, song_version_company。
-
song_feature
- 包含歌曲的特征信息。
- 主要字段:song_id, song_scenario, song_ifvocal, vocal_gender, vocal_language, song_type。
-
song_annotation_compute
- 包含通过librosa和madmom库分析的歌曲音乐特征。
- 主要字段:song_id, librosa_beat_times, librosa_chromagram, librosa_duration, librosa_mfcc, librosa_onset, librosa_sr, librosa_tempo, madmom_onset。
-
song_annotation_compute_mirtoolbox
- 包含通过MIRtoolbox分析的歌曲音乐特征。
- 主要字段:song_id, mirbrightness, mirbrightness_r, mirchromagram, mirkey, mirkey_r, mirmode, mirmode_r, mirpitch。
-
song_annotation_expert
- 包含音乐专家通过Sonic Visualiser加注的歌曲音乐特征。
- 主要字段:song_id, special, structure, melody_phrase, cadence, lyric_phrase, structure_plus, serial_number, sv。
-
person_info
- 包含受试者的基本背景信息。
- 主要字段:id, gender, age, education, ethnic, language, institution。
-
person_musicbg
- 包含受试者的音乐背景信息。
- 主要字段:id, instrument, years。
-
person_artist_prefer
- 包含受试者的歌手喜好信息。
- 主要字段:id, artist。
-
nursing_record_dynamic
- 包含生理量测的动态信息。
- 主要字段:date, id, song_id, song_start, song_end, heart_rate, activity, sleep_quality。
-
nursing_record_static
- 包含生理量测的静态信息。
- 主要字段:date, id, song_id, song_start, song_end, scr, hrv, fer, sp。
-
questionnaire
- 包含问卷结果与睡眠品质信息。
- 主要字段:id, ques_bsrs5, ques_mmse, ques_moca。
文件命名规则
- 使用song_id的文件增加为7位数(0000001)。
- id为4位数(0001)。
搜集汇总
数据集介绍

构建方式
Music-Health-Dataset 数据集的构建主要依托于对歌曲的深度学习标注,涉及到的歌曲用于生理测量。数据集由多个表格组成,包括歌曲基本信息、歌曲路径、歌曲特征等,各表格通过歌曲ID进行关联。歌曲特征信息的获取采用了Python的librosa和madmom库,以及对MATLAB的MIRtoolbox的分析结果,以及音乐专家通过Sonic Visualiser进行的标注。
特点
该数据集的特点在于其多维度的数据构成,不仅包含了歌曲的基本信息,如歌曲名、艺术家、发行年份等,还详细记录了歌曲的音乐特征,如色度图、梅尔频率倒谱系数等。此外,数据集还包含了受试者的背景信息、音乐背景、歌手喜好,以及生理测量动态和静态数据,为音乐与健康领域的研究提供了全面的数据支持。
使用方法
使用该数据集时,研究者可以根据需要选择不同的表格进行数据调用。例如,若需分析歌曲特征与生理测量数据的关系,可以结合song_feature和nursing_record_dynamic表格。此外,数据集还提供了详细的受试者信息,有助于进行人群特征与音乐偏好的相关性研究。对于数据集的使用,研究者需要遵循数据文件的命名规则,确保正确读取数据。
背景与挑战
背景概述
Music-Health-Dataset是一个专注于音乐与生理健康相关性的数据库。该数据集由台湾的科研团队创建于近年,旨在研究音乐对人类生理指标的影响。数据集涵盖了歌曲的基本信息、歌曲路径、歌曲特征、音乐特征标注、受试者信息、生理测量动态和静态信息、问卷结果等多个方面。其核心研究问题是探究特定类型的音乐如何影响人的生理反应,例如心率、皮肤电导等。Music-Health-Dataset的创建为音乐疗法和健康监测领域的研究提供了重要的数据资源,对相关领域产生了积极的影响。
当前挑战
在构建Music-Health-Dataset的过程中,研究人员面临了多个挑战。首先,歌曲特征的提取需要精确的音频处理技术,这对计算资源和算法都提出了较高的要求。其次,确保受试者生理数据的准确性和可靠性也是一个挑战,因为生理信号的采集容易受到外界环境的干扰。此外,数据集的多样性和代表性也是构建过程中的一个重要考虑因素,需要确保所选歌曲和受试者群体的代表性,以便研究成果能够推广到更广泛的人群。
常用场景
经典使用场景
Music-Health-Dataset是一个专注于音乐与生理健康相关的数据集。其经典使用场景在于通过音乐对受试者的生理指标进行量测,分析不同音乐类型、特征与受试者生理反应之间的关系,从而为音乐疗法和个性化音乐推荐提供科学依据。
实际应用
在实际应用中,Music-Health-Dataset可被用于开发音乐辅助治疗系统,设计针对特定人群如老年人的听力恢复训练,或者用于创建个性化的音乐播放列表,以改善用户的心理状态和生活质量。
衍生相关工作
基于Music-Health-Dataset的研究衍生出了多项相关工作,如音乐对情绪调节的影响、音乐疗法的有效性评估、个性化音乐推荐算法等,这些研究进一步扩展了音乐与生理健康领域的知识边界。
以上内容由遇见数据集搜集并总结生成



