five

wcs-music-database-v1

收藏
Hugging Face2025-10-30 更新2025-10-31 收录
下载链接:
https://huggingface.co/datasets/westie-data-collective/wcs-music-database-v1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含大量由西海岸摇摆DJ以及WCS社区其他成员创建的播放列表的数据集。该数据集可以用来分析不同事件、DJ、世界区域或随时间的音乐播放趋势。数据集已经进行了预处理,分为不同的表格,包括播放列表、曲目和播放列表曲目,并且已经对曲目进行了去重处理。
创建时间:
2025-10-23
原始信息汇总

WCS Music Database 数据集概述

基本信息

  • 数据集名称: WCS Music Database
  • 许可证: GPL-3.0
  • 维护组织: Westie Data Collective

数据配置

数据集包含6个配置模块:

1. playlists(默认配置)

  • 数据文件: data_playlist_metadata.parquet
  • 用途: 播放列表元数据

2. playlist_tracks

  • 数据文件: data_playlist_songs.parquet
  • 用途: 播放列表歌曲关联数据

3. tracks

  • 数据文件: data_song_metadata.parquet
  • 用途: 歌曲元数据

4. track_lyrics

  • 数据文件: data_song_lyrics.parquet
  • 用途: 歌曲歌词数据

5. track_duplicates

  • 数据文件: data_song_duplicates.parquet
  • 用途: 歌曲去重数据

6. track_canonical

  • 数据文件: data_song_canonical.parquet
  • 用途: 规范化歌曲数据

数据内容

  • 包含西海岸摇摆舞DJ和WCS社区成员的大量播放列表
  • 支持分析不同活动、DJ、地区和时间段的音乐趋势差异

数据预处理

  • 数据已分割为播放列表、歌曲和播放列表歌曲关联表
  • 歌曲已去重处理,每个(艺术家名称,歌曲名称)元组在tracks表中仅出现一次

源数据

  • 源数据集: westie-data-collective/wcs-music-database-source-data
  • 源数据地址: https://huggingface.co/datasets/westie-data-collective/wcs-music-database-source-data
搜集汇总
数据集介绍
main_image_url
构建方式
在音乐信息学领域,该数据集通过系统化采集西海岸摇摆舞社区DJ及爱好者的播放列表构建而成。原始数据经过精心预处理,采用多表分离架构将播放列表元数据、曲目信息与播放列表-曲目关联关系分别存储于独立数据表中。通过建立艺术家名称与曲目名称的元组去重机制,确保每个独特音乐作品在曲目表中仅保留单一记录,这种规范化处理为音乐趋势分析提供了纯净的数据基础。
特点
该数据集最显著的特征在于其聚焦西海岸摇摆舞音乐场景的专属性,完整收录了跨地域、跨时段的不同DJ播放列表。数据结构采用模块化设计,包含播放列表元数据、曲目元数据、歌词内容及去重版本等多个专业子集,支持对音乐演变趋势的多维度解析。通过标准化处理的权威曲目表,研究者可精准追踪特定音乐作品在不同文化语境中的传播轨迹与接受程度。
使用方法
对于音乐社会学研究者而言,该数据集支持通过配置名称灵活调用不同数据模块。选取playlists配置可分析播放列表的时空分布特征,调用tracks与track_lyrics配置则能深入探究音乐文本与旋律的关联规律。利用playlist_tracks的关联映射功能,可构建DJ选曲偏好网络,而track_canonical提供的权威版本数据尤为适合进行跨文化音乐传播的纵向研究。
背景与挑战
背景概述
WCS音乐数据库作为舞蹈音乐分析领域的重要资源,由西海岸摇摆舞社群于2023年构建完成,其核心价值在于系统性地收录了全球西海岸摇摆舞DJ与爱好者的播放列表数据。该数据库通过多维度音乐元数据架构,为研究舞蹈音乐演变规律、地域文化差异及DJ创作风格提供了实证基础,显著推进了计算音乐学与舞蹈文化研究的交叉融合。
当前挑战
在音乐信息检索领域,该数据集需解决舞曲特征与舞蹈动作关联性的量化难题,包括节奏模式识别、和声行进分析等核心问题。数据构建过程中面临原始数据异构性挑战,需通过艺术家-曲目元组去重算法消除重复记录,并建立标准化跨表关联体系以保持数据一致性。
常用场景
经典使用场景
在音乐信息检索领域,WCS音乐数据库为分析西海岸摇摆舞曲目的演变规律提供了重要支撑。研究者通过挖掘播放列表与曲目元数据的关联模式,能够系统追踪不同DJ、地域及时间维度下的音乐偏好变迁,这种基于海量社区数据的动态分析已成为音乐推荐算法优化的经典范例。
衍生相关工作
该资源催生了多项音乐计算领域的创新研究,包括基于图神经网络的跨平台播放列表生成模型,以及融合时空特征的舞蹈音乐流行度预测算法。部分学者进一步利用其去重机制开发了音乐元数据标准化管道,这些衍生工作持续推动着智能音乐分析技术的前沿发展。
数据集最近研究
最新研究方向
在音乐信息检索领域,WCS音乐数据库为分析西海岸摇摆舞社群音乐偏好演变提供了独特视角。当前研究聚焦于利用该数据集的多模态特性,结合播放列表元数据与歌词内容,探索舞蹈音乐风格的时空传播规律。前沿工作正通过图神经网络建模DJ-曲目关联网络,揭示社群文化影响下的音乐流行机制,同时借助跨区域对比分析,为音乐推荐系统提供具有文化适应性的算法框架。这些研究不仅深化了对舞蹈音乐生态系统的认知,更推动了自适应音乐计算模型在跨文化场景中的应用突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作