five

SiTunes|音乐推荐数据集|用户体验研究数据集

收藏
github2024-03-15 更新2024-05-31 收录
音乐推荐
用户体验研究
下载链接:
https://github.com/JiayuLi-997/SiTunes_dataset
下载链接
链接失效反馈
资源简介:
SiTunes是一个音乐推荐数据集,包含了基于真实世界用户研究的丰富生理情境信息和心理反馈信号。数据集通过三阶段用户研究收集,包括实验室研究收集用户的固有偏好(第一阶段),以及两个现场研究记录用户日常生活中的情境、偏好和心理反馈,分别使用传统推荐器(第二阶段)和情境推荐器(第三阶段)。

SiTunes is a music recommendation dataset that encompasses rich physiological context information and psychological feedback signals based on real-world user studies. The dataset was collected through a three-phase user study, including laboratory research to gather users' inherent preferences (Phase 1), and two field studies documenting users' contexts, preferences, and psychological feedback in daily life, utilizing traditional recommenders (Phase 2) and contextual recommenders (Phase 3), respectively.
创建时间:
2023-04-17
原始信息汇总

数据集概述

SiTunes 是一个包含丰富生理情境信息和心理反馈信号的音乐推荐数据集,基于真实用户研究收集。数据集详细信息可在 SiTunes 中找到。

数据收集过程

SiTunes 通过三阶段用户研究收集:

  1. Stage 1:实验室研究,收集用户固有偏好。
  2. Stage 2:现场研究,记录用户日常生活中的情境、偏好及心理反馈,使用传统推荐系统。
  3. Stage 3:现场研究,使用情境推荐系统。

基本统计信息

阶段 #用户 #项目 #交互 生理信号 心理信号 环境数据 评分 心理反馈
Stage 1 30 25 600 - - -
Stage 2 30 105 897
Stage 3 10 217 509
总计 30 307 2,006
  • 生理信号:包括心率、活动强度、活动步数和活动类型。
  • 心理信号:指听音乐前的情绪记录,测量维度为愉悦度和激发度。
  • 环境数据:包括时间、天气信息(类型、压力、温度、湿度)和位置详情(经度、纬度、速度)。
  • 评分:基于五点李克特量表的用户评分。
  • 心理反馈:听音乐后的情绪反应,也测量愉悦度和激发度。

实验

情境音乐推荐

  • 实验设置
    1. 使用Stage 1训练,Stage 2测试。
    2. Stage 2数据用于训练和测试,比较有无情境信息的影响。
    3. Stage 2训练,Stage 3测试,比较传统和情境推荐系统的差异。
  • 实验结果:情境信息显著提高推荐系统的性能。

心理满意度作为推荐反馈

  • 实验设置:使用三种情境信息组合预测用户听音乐后的情绪变化。
  • 实验结果:结合客观和主观情境特征(Obj.+Sub.)在Stage 2中表现最佳。

数据集挑战

数据集收集过程中面临的挑战未在README中详细说明。

AI搜集汇总
数据集介绍
main_image_url
构建方式
SiTunes数据集的构建基于一项三阶段的用户研究,旨在捕捉用户在音乐推荐系统中的生理与心理反馈。第一阶段在实验室环境中收集用户的固有偏好;第二阶段和第三阶段则分别在用户的日常生活中记录其情境、偏好及心理反馈,分别使用传统推荐系统和情境推荐系统。数据收集过程中,涵盖了心率、活动强度、情绪状态等生理信号,以及时间、天气、位置等环境数据,确保数据的多样性与全面性。
特点
SiTunes数据集的特点在于其丰富的情境信息与多维度的用户反馈。数据集不仅包含用户的音乐评分,还记录了用户在听音乐前后的情绪变化,以及心率、活动类型等生理信号。此外,环境数据如天气、时间、位置等也被详细记录,为情境音乐推荐提供了坚实的基础。数据集的多样性与细致性使其成为研究音乐推荐系统中情境因素与心理反馈的理想选择。
使用方法
SiTunes数据集的使用方法主要围绕情境音乐推荐与心理满意度预测两大任务展开。在情境音乐推荐任务中,数据集被划分为不同阶段,分别用于训练与测试,以探索情境信息对推荐效果的影响。在心理满意度预测任务中,数据集通过结合客观情境特征与主观情绪特征,预测用户在听音乐后的情绪变化。实验结果表明,情境信息的引入显著提升了推荐系统的性能,验证了数据集在音乐推荐研究中的实用价值。
背景与挑战
背景概述
SiTunes数据集是一个专注于情境音乐推荐的反馈数据集,结合了生理与心理信号,旨在通过真实世界的用户研究提供丰富的情境信息与心理反馈信号。该数据集由三个阶段的研究构成,包括实验室研究以收集用户的固有偏好(第一阶段),以及两个现场研究以记录用户在日常生活中使用传统推荐系统(第二阶段)和情境推荐系统(第三阶段)时的情境、偏好与心理反馈。SiTunes的创建为音乐推荐系统的研究提供了新的视角,尤其是在情境感知与用户心理反馈的结合方面,推动了推荐系统在个性化与情感化方向的发展。
当前挑战
SiTunes数据集在构建与应用过程中面临多重挑战。首先,情境音乐推荐的核心问题在于如何有效整合用户的生理信号、环境数据与心理反馈,以捕捉用户在不同情境下的偏好变化。这一问题的复杂性在于情境数据的多样性与动态性,如何从中提取有效特征并构建鲁棒的推荐模型成为关键挑战。其次,数据收集过程中,确保用户隐私的同时获取高质量的生理与心理信号数据也面临技术难题,例如心率数据的归一化与地理位置信息的隐私保护。此外,不同阶段数据的分布差异可能导致模型在跨阶段预测时性能下降,如何缓解这种分布差异对模型的影响也是亟待解决的问题。
常用场景
经典使用场景
在音乐推荐系统的研究中,SiTunes数据集被广泛应用于情境感知的音乐推荐任务。该数据集通过整合用户的生理信号、心理反馈以及环境数据,为研究者提供了一个多维度的视角,以探索用户在不同情境下的音乐偏好变化。例如,在用户进行运动或处于特定天气条件下,推荐系统能够根据这些情境信息调整推荐策略,从而提升用户体验。
实际应用
在实际应用中,SiTunes数据集为音乐流媒体平台提供了强大的技术支持。通过分析用户的生理信号和环境数据,平台能够实时调整推荐内容,满足用户在不同情境下的需求。例如,在用户进行高强度运动时,系统可以推荐节奏感强的音乐;而在用户处于放松状态时,则推荐舒缓的音乐。这种情境感知的推荐策略不仅提升了用户满意度,还增强了平台的用户粘性。
衍生相关工作
基于SiTunes数据集,研究者们开展了多项经典工作,进一步推动了音乐推荐领域的发展。例如,有研究提出了基于情境信息的深度推荐模型,通过结合用户的生理信号和环境数据,显著提升了推荐精度。此外,还有研究探索了心理满意度预测任务,利用用户的情感反馈优化推荐算法。这些工作不仅验证了SiTunes数据集的价值,还为未来的研究提供了新的方向。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

NREL Wind Integration National Dataset (WIND) Toolkit

NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。

www.nrel.gov 收录

ImageNet-1K(ILSVRC2012)

ImageNet-1K(ILSVRC2012)是一个大规模的图像分类数据集,包含1000个类别的图像,用于训练和验证图像分类模型。

github 收录