five

Eurovision Song Contest Dataset|音乐比赛数据集|数据分析数据集

收藏
github2024-05-17 更新2024-05-31 收录
音乐比赛
数据分析
下载链接:
https://github.com/Spijkervet/eurovision_dataset
下载链接
链接失效反馈
资源简介:
Eurovision Song Contest数据集是一个免费提供的数据集,包含1735首参赛歌曲的音频特征、元数据、比赛排名和投票数据,这些歌曲参与了从1956年到2023年的Eurovision Song Contest。

The Eurovision Song Contest dataset is a freely available dataset that includes audio features, metadata, competition rankings, and voting data for 1,735 participating songs. These songs were part of the Eurovision Song Contest from 1956 to 2023.
创建时间:
2019-10-11
原始信息汇总

数据集概述

数据集名称

  • 名称: Eurovision Song Contest Dataset

数据集内容

  • 包含数据: 包含1735首参赛歌曲的元数据、比赛排名和投票数据。
  • 更新频率: 每年更新,包含最新的比赛结果。
  • 数据来源: 数据由EurovisionWorld网站提供。

数据集下载与使用

  • 下载链接: GitHub链接
  • 使用指南: 提供了一个示例Jupyter Notebook,位于examples目录中。
  • 复制数据集: 使用scrape_votes.pyscrape_odds.py脚本,通过Docker或本地环境进行数据抓取。

数据集文件描述

  • contestants.csv: 包含参赛歌曲的详细信息,如年份、国家、艺术家、歌曲标题等。
  • votes.csv: 包含投票数据,包括年份、轮次、投票国家和接收国家等。

音频数据

  • 音频收集: 使用audio.py脚本或通过Docker容器收集YouTube音频流。
  • 音频特征提取: 使用audio_features.shaudio_features.py提取音频特征。

引用信息

  • 引用格式:

    @inproceedings{burgoyne_mirovision, author = {John Ashley Burgoyne and Janne Spijkervet and David John Baker}, title = {Measuring the {Eurovision Song Contest}: A Living Dataset for Real-World {MIR}}, booktitle = {Proceedings of the 24th International Society for Music Information Retrieval Conference}, year = 2023, address = {Milan, Italy}, url = {https://archives.ismir.net/ismir2023/paper/000097.pdf} }

    @misc{spijkervet_eurovision, author = {Janne Spijkervet}, title = {{The Eurovision Dataset}}, month = mar, year = 2020, doi = {10.5281/zenodo.4036457}, version = {1.0}, publisher = {Zenodo}, url = {https://zenodo.org/badge/latestdoi/214236225} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
Eurovision Song Contest Dataset的构建基于对Eurovision Song Contest自1956年以来的所有参赛歌曲的元数据、比赛排名及投票数据的系统性收集。数据主要来源于EurovisionWorld网站,并通过自动化脚本进行抓取和整理。数据集每年更新,确保包含最新的比赛结果。此外,数据集还计划包含音频特征,通过YouTube链接获取音频流,并使用Essentia工具提取音频特征。
使用方法
使用该数据集时,用户可以通过下载预处理的数据文件或使用提供的抓取脚本自行生成数据。数据集提供了详细的CSV文件,如contestants.csv和votes.csv,用户可以通过这些文件进行数据分析。此外,数据集还提供了示例Jupyter Notebook,帮助用户快速上手。对于音频数据的处理,用户可以通过运行audio.py脚本从YouTube获取音频流,并使用audio_features.sh脚本提取音频特征。
背景与挑战
背景概述
Eurovision Song Contest Dataset(欧洲歌唱大赛数据集)是一个包含1735首参赛歌曲的元数据、比赛排名和投票数据的开放数据集。该数据集由Janne Spijkervet创建,并得到了John Ashley Burgoyne和David John Baker的扩展,主要用于音乐信息检索(MIR)领域的研究。自1956年首届比赛以来,该数据集每年都会更新,涵盖了从初赛到决赛的所有比赛结果。数据集的元数据和投票数据来源于EurovisionWorld网站,未来版本还将包含音频特征。该数据集的发布为研究者提供了丰富的资源,以探索欧洲歌唱大赛的历史、文化和社会影响,尤其是在音乐分析和跨文化交流领域具有重要意义。
当前挑战
Eurovision Song Contest Dataset在构建和应用过程中面临多项挑战。首先,数据集的构建依赖于从EurovisionWorld网站的抓取,这要求开发者具备高效的网络爬虫技术和数据清洗能力,以确保数据的准确性和完整性。其次,随着时间的推移,比赛规则和投票机制的变化为数据的标准化处理带来了复杂性,尤其是在处理不同年份的半决选和决赛数据时。此外,音频特征的提取和分析也是一个技术难点,需要借助先进的音频处理工具和算法。最后,跨文化投票数据的分析涉及复杂的社交网络和心理因素,如何从中提取有意义的模式和趋势也是一个重要的研究挑战。
常用场景
经典使用场景
Eurovision Song Contest Dataset的经典使用场景主要集中在音乐信息检索(MIR)领域,研究者可以利用该数据集分析歌曲的音频特征、歌词内容以及比赛排名和投票数据。通过这些数据,研究者能够探索音乐风格、文化影响以及观众和评委的偏好,从而揭示音乐在全球范围内的传播和接受模式。
解决学术问题
该数据集解决了音乐信息检索领域中关于音乐风格识别、文化影响分析以及观众和评委偏好研究的关键问题。通过分析比赛排名和投票数据,研究者可以深入探讨不同文化背景下的音乐偏好差异,为音乐传播和文化交流提供科学依据。此外,数据集中的音频特征和歌词内容为音乐情感分析和自动标注提供了丰富的素材。
实际应用
Eurovision Song Contest Dataset在实际应用中具有广泛的价值,特别是在音乐产业和文化研究领域。音乐制作人可以利用该数据集分析流行音乐趋势,优化创作策略。文化研究者则可以通过分析投票数据,探讨不同国家间的文化交流和影响,为跨文化传播研究提供数据支持。此外,该数据集还可用于开发音乐推荐系统和情感分析工具。
数据集最近研究
最新研究方向
近年来,Eurovision Song Contest Dataset在音乐信息检索(MIR)领域引起了广泛关注。该数据集不仅包含了从1956年至今的参赛歌曲元数据和投票数据,还计划引入音频特征,这为研究者提供了丰富的资源。特别是,Burgoyne等人通过扩展数据集,增加了陪审团级别的数据和新音频特征,进一步推动了该数据集在MIR领域的应用。这些研究不仅有助于分析音乐特征与比赛结果之间的关系,还为音乐情感分析、自动标签生成等前沿研究提供了基础。此外,数据集的动态更新特性使其成为研究音乐流行趋势和文化交流的理想平台,对理解全球音乐文化的影响具有重要意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

GetData.IO - finance - Google Search

GetData.IO -

getdata.io 收录