five

GlobalMood

收藏
arXiv2025-05-15 更新2025-05-16 收录
下载链接:
https://osf.io/8c5f2
下载链接
链接失效反馈
官方服务:
资源简介:
GlobalMood 是一个新颖的跨文化基准数据集,包含来自59个国家的1180首歌曲,并由来自5个文化和语言不同地区的2519人进行了大规模标注。数据集采用了自下而上的参与者驱动方法,以有机地引出文化特定的与音乐相关的情绪术语。然后,我们又招募了另一组人类参与者,为这些文化特定描述符收集了988,925个评分。我们的分析证实了跨文化中存在的效价-唤醒结构,同时也揭示了某些情绪术语在跨文化感知中的显著差异。

GlobalMood is a novel cross-cultural benchmark dataset comprising 1,180 songs from 59 countries, which was extensively annotated by 2,519 participants from 5 culturally and linguistically distinct regions. The dataset adopts a bottom-up, participant-driven approach to organically elicit culture-specific music-related emotion terms. Subsequently, we recruited an additional cohort of human participants to collect 988,925 ratings for these culture-specific descriptors. Our analyses confirm the existence of valence-arousal structure across cultures, while also revealing significant disparities in the cross-cultural perception of certain emotion terms.
提供机构:
马克斯·普朗克美学研究所
创建时间:
2025-05-15
原始信息汇总

数据集概述

基本信息

  • 标题: [Data] GlobalMood: A cross-cultural benchmark for music emotion recognition
  • 大小: 38.6MB
  • 公开状态: Public
  • 创建日期: 2025-03-29 07:31 PM
  • 最后更新日期: 2025-05-14 07:02 PM
  • 标识符: DOI 10.17605/OSF.IO/8C5F2
  • 类别: Project

描述

This is the data repository for paper entitled GlobalMood: A cross-cultural benchmark for music emotion recognition

贡献者

  1. Harin Lee
  2. Elif Celen
  3. Peter Harrison
  4. Manuel Anglada-Tort
  5. Pol van Rijn
  6. Minsu Park
  7. Marc Schönwiesner
  8. Nori Jacoby

文件

  • GlobalMood-data/GlobalMood_raw_ratings_across_5_countries.csv
  • GlobalMood-data/GlobalMood_song_metadata.csv

引用

APA

Lee, H., Celen, E., Harrison, P. M. C., Anglada-Tort, M., van Rijn, P., Park, M., … Jacoby, N. (2025, May 14). [Data] GlobalMood: A cross-cultural benchmark for music emotion recognition. https://doi.org/10.17605/OSF.IO/8C5F2

MLA

Lee, Harin et al. “[Data] GlobalMood: A Cross-Cultural Benchmark for Music Emotion Recognition.” OSF, 14 May 2025. Web.

Chicago

Lee, Harin, Elif Celen, Peter M C Harrison, Manuel Anglada-Tort, Pol van Rijn, Minsu Park, Marc Schönwiesner, and Nori Jacoby. 2025. “[Data] GlobalMood: A Cross-Cultural Benchmark for Music Emotion Recognition.” OSF. May 14. doi:10.17605/OSF.IO/8C5F2.

搜集汇总
数据集介绍
main_image_url
构建方式
GlobalMood数据集的构建采用了跨文化、自下而上的创新方法。研究团队从59个国家的YouTube音乐排行榜中精选了1,180首歌曲,确保覆盖全球多样化的音乐传统。数据收集分为两个阶段:第一阶段通过迭代式标注链,让来自美国、法国、墨西哥、韩国和埃及的参与者用母语自由描述音乐情绪;第二阶段则针对每种语言筛选出的前20个情绪标签,对全部歌曲进行大规模评分,最终获得988,925个跨文化情绪评分。这种参与者驱动的方法有效避免了预定义英语情绪分类的文化局限性。
特点
GlobalMood数据集具有三个显著特征:文化包容性、语言多样性和方法论创新性。其音乐样本均衡覆盖全球59个国家,情绪标签源自五个不同文化背景参与者的母语表达,包括英语、法语、西班牙语、韩语和阿拉伯语。通过多维标度分析发现,尽管存在跨文化共享的效价-唤醒结构,但某些字典等价的情绪标签(如“happy”)在不同文化中呈现显著感知差异。数据集还揭示了非西方文化特有的情绪描述(如韩语中的“appeal/plead”),为音乐情绪识别提供了更丰富的文化视角。
使用方法
该数据集为音乐信息检索领域提供了多重应用路径。研究者可利用其进行跨文化情绪识别模型的训练与评估,特别适用于改进非英语语境下的模型表现。通过对比零样本、少样本和微调场景下多模态模型(如Gemini和CLAP)的表现,证明跨文化数据能显著提升模型在非西方音乐理解上的性能。数据集还可作为情感计算、音乐推荐系统开发的基准,其开放的迭代标注框架也能拓展至其他多模态和跨语言研究领域。使用时需注意保留原始语言标签的文化特异性,避免简单翻译造成的语义流失。
背景与挑战
背景概述
GlobalMood数据集由马克斯·普朗克经验美学研究所等国际团队于2025年推出,旨在解决音乐情感识别领域长期存在的文化偏差问题。该数据集包含来自59个国家的1,180首歌曲,通过2,519名参与者的跨文化标注,收集了988,925条情绪评分,采用自下而上的标注方法突破传统西方中心主义的英语情绪标签限制。作为首个系统涵盖阿拉伯语、法语、韩语等五种语言的音乐情绪基准,其创新性地揭示了情绪效价-唤醒度结构的跨文化共性,以及词典等价词在实际感知中的文化特异性,为音乐信息检索、推荐系统和生成模型的跨文化适配提供了关键基础设施。
当前挑战
音乐情感识别领域长期面临两大核心挑战:在问题层面,现有系统依赖西方音乐和英语情绪标签,导致对非西方音乐(如韩国传统音乐)和文化特异性情绪(如韩语中的'간절히/恳切')的识别准确率显著下降;在构建层面,GlobalMood需克服多语言情绪术语的语义不对等性(如英语'happy'与阿拉伯语对应词的感知差异)、跨文化音乐刺激的平衡采样(确保59国音乐的风格代表性),以及迭代标注中的初始参与者偏差(前序标注可能影响后续情绪术语生成)。数据集通过双重验证链和并行标注组设计有效控制了这些变量,但歌词对情绪判断的潜在影响仍待后续研究解决。
常用场景
经典使用场景
GlobalMood数据集在音乐情感识别领域具有广泛的应用价值,尤其在跨文化音乐情感分析中表现突出。该数据集通过自下而上的方式收集了来自59个国家的1180首歌曲的大规模情感标注,涵盖了美国、法国、墨西哥、韩国和埃及五个不同文化背景的2519名参与者的情感评价。这种数据收集方法使得GlobalMood能够捕捉到文化特定的情感词汇,为音乐情感识别提供了丰富的跨文化数据支持。
衍生相关工作
GlobalMood数据集已经衍生出多项经典研究工作,特别是在跨文化音乐情感识别和多模态模型优化方面。例如,研究人员利用该数据集对Gemini和CLAP等模型进行了跨文化性能评估,发现模型在非英语文化背景下的表现显著提升。此外,GlobalMood还为情感词汇的跨文化比较研究提供了数据支持,推动了音乐情感识别领域的进一步发展。
数据集最近研究
最新研究方向
GlobalMood数据集的推出标志着音乐情感识别(MER)领域的一个重要转折点,特别是在跨文化和多语言背景下。该数据集通过自下而上的参与者驱动方法,收集了来自59个国家的1,180首歌曲,并由2,519名来自不同文化背景的参与者进行标注,生成了988,925个情绪评分。这一创新方法不仅揭示了情绪描述词在跨文化中的共性与差异,还凸显了传统基于英语的情绪分类在非西方音乐中的局限性。当前研究热点集中在利用多模态大语言模型(如Gemini和CLAP)进行跨文化情绪识别的性能优化,特别是在零样本、少样本和微调场景下的表现。研究结果表明,经过跨文化数据微调的模型在非英语语境中的表现显著提升,为开发更具包容性的音乐推荐系统和生成模型提供了重要支持。此外,该数据集还为情感描述词的普遍性与文化特异性之间的争论提供了实证依据,推动了跨学科研究的发展。
相关研究论文
  • 1
    GlobalMood: A cross-cultural benchmark for music emotion recognition马克斯·普朗克美学研究所 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作