music_survey_data
收藏github2025-09-15 更新2025-09-16 收录
下载链接:
https://github.com/WalksWithASwagger/vanai-hackathon-004
下载链接
链接失效反馈官方服务:
资源简介:
一个包含1,261+份调查响应的数据集,涉及人们如何发现音乐、使用的音乐格式以及对AI生成音乐的感受。数据集包含19个核心问题,涵盖音乐发现、格式演变和AI态度,以及丰富的人口统计信息如年龄、位置、教育、收入和家庭组成。
This dataset contains over 1,261 survey responses regarding how people discover music, the audio formats they utilize, and their perceptions of AI-generated music. It includes 19 core questions covering music discovery, format evolution, and attitudes towards AI, alongside rich demographic information such as age, geographic location, educational background, income, and household composition.
创建时间:
2025-09-15
原始信息汇总
数据集概述
基本信息
- 数据集名称:Vancouver AI Hackathon Round 4: The Soundtrack of Us
- 数据规模:1,000+ 份完整调查回复
- 数据来源:加拿大各地音乐听众的调查回复
- 主要数据文件:
data/raw/music_survey_data.csv
数据内容
核心问题
- 19个核心问题涵盖音乐发现、格式演变和AI态度
- 音乐发现:人们如何发现新音乐(广播、流媒体、社交媒体等)
- 格式演变:个人与黑胶、磁带、CD、下载、流媒体等格式的体验
- 收听习惯:人们在日常生活中收听音乐的时间和方式
- AI音乐态度:对AI生成音乐和声音克隆的回应
- 社交分享:人们如何分享音乐及其"罪恶快感"
- 个人联系:人生主题曲和有意义的歌词
人口统计信息
- 年龄组:18-34岁、35-54岁、55岁以上
- 省份:地理分布(安大略省40%+、不列颠哥伦比亚省20%+、艾伯塔省、魁北克省等)
- 教育:教育水平
- 家庭收入:家庭收入情况
- 性别:性别分布
文本数据
- 3,000+文本回复包含情感分析分数
- 包含极性度和主观性度量
- 提供情感内容的百分比分数
数据结构
关键列
Q1_Relationship_with_music:音乐参与程度Q2_Discovering_music:主要音乐发现方法Q4_Music_format_changes:格式转换体验Q7_New_music_discover_*:多种发现方法Q8_Music_listen_time_GRID_*:按活动划分的收听习惯Q10_Songs_by_AI:对AI生成音乐的态度Q11_Use_of_dead_artists_voice_feelings:AI声音克隆观点Q12_Music_bingo_*:音乐相关行为Q13_Share_the_music_you_love_*:音乐分享方法Q15_Music_guilty_pleasure:音乐"罪恶快感"Q18_Life_theme_song:个人主题曲Q19_Lyric_that_stuck_with_you:有意义的歌词
相关文件
data/raw/survey_questions.txt:调查问题说明文件scripts/explore_data.py:数据快速查看脚本scripts/data_preprocessing.py:数据预处理脚本
适用场景
- 创建数据可视化
- 开发应用程序
- 获取关于音乐和技术的洞察
- 交互式、可视化或叙事驱动的体验项目
搜集汇总
数据集介绍

构建方式
在音乐与技术交叉研究领域,music_survey_data数据集通过结构化问卷调查构建,覆盖加拿大境内千余名受访者。采用多维度问题设计,涵盖音乐发现方式、格式演进历程、人工智能音乐态度等19个核心议题,同时整合人口统计学变量与情感分析指标,确保数据采集的全面性与科学性。
使用方法
研究者可通过CSV格式直接加载数据集,利用Python的pandas库或R的tidyverse套件进行数据分析。内置的探索脚本可快速生成数据概览,而预处理程序能有效处理缺失值与文本清洗。数据集支持多学科研究范式,既适用于传统统计建模,也可结合自然语言处理技术挖掘文本深层语义。
背景与挑战
背景概述
音乐调查数据集music_survey_data由Vancouver AI Hackathon组织于2025年9月创建,旨在探索当代音乐消费行为与技术融合的复杂图景。该数据集收录了加拿大境内1000余份完整调查反馈,涵盖音乐发现方式、格式演进历程、人工智能生成音乐态度等19个核心维度。通过整合人口统计学特征与情感分析指标,该资源为理解数字化时代音乐文化的演变提供了实证基础,对音乐信息检索、推荐系统优化及人机交互研究具有显著价值。
当前挑战
本数据集致力于解决音乐消费行为量化分析与AI技术接受度评估的双重挑战,包括多模态音乐发现路径的建模、传统与数字格式过渡的心理机制解析,以及公众对AI生成艺术的情感认知测量。数据构建过程中需克服受访者地理分布均衡性控制、开放式文本情感标注的一致性校验,以及跨年龄段音乐体验历史差异的标准化表述等难题,这些因素共同构成了数据质量保障的核心瓶颈。
常用场景
经典使用场景
在音乐信息检索与计算社会科学交叉领域,该数据集为研究者提供了探索音乐消费行为演变的珍贵素材。通过分析千余份涵盖多维度调查响应的数据,学者能够深入挖掘传统媒体与流媒体平台在音乐发现机制中的相对影响力,以及不同代际群体在格式迁移过程中的行为差异特征。
解决学术问题
该数据集有效解决了音乐社会学中关于技术接受度的量化研究难题,特别是人工智能生成音乐的社会认知测量问题。通过结构化采集听众对AI创作音乐的情感态度与道德边界认知,为建立音乐技术伦理评估框架提供了实证基础,填补了传统音乐研究缺乏大规模态度数据的空白。
实际应用
音乐流媒体平台可借助该数据集构建用户画像优化系统,通过分析不同 demographic 群体的音乐发现路径与情感偏好,实现个性化推荐算法的精准调优。文化政策制定者则能依据数据中地域性消费差异,设计更有效的音乐产业扶持策略与数字化转型方案。
数据集最近研究
最新研究方向
在音乐信息检索与计算社会科学交叉领域,music_survey_data数据集正推动对AI生成音乐社会接受度的前沿探索。研究聚焦于多模态推荐系统与人类音乐发现行为的认知差异,结合情感分析技术解析用户对传统格式演变的怀旧情绪与数字流媒体适应性之间的张力。当前热点集中于生成式AI在音乐创作中的伦理边界,特别是利用死者声音克隆技术引发的文化传承与隐私权争议。该数据集通过涵盖人口统计学与地理分布的多维度变量,为构建音乐消费行为预测模型提供了重要基准,其关于生命主题歌曲与深度歌词记忆的文本数据,正成为音乐心理学与人工智能交叉研究的关键语料。
以上内容由遇见数据集搜集并总结生成



