JAMSessions

Name: JAMSessions
Creator: Johannes Kepler University Linz, Austria and Deezer Research Paris, France
Published: 2025-07-22 01:36:03
License: 暂无描述

arXiv2025-07-22 更新2025-08-14 收录

下载链接：

https://github.com/hcai-mms/jam

下载链接

链接失效反馈

官方服务：

资源简介：

JAMSessions是一个包含超过100k用户-查询-物品三元组的新数据集，它包括匿名用户/物品嵌入，并结合了对话查询和用户长期偏好。该数据集从音乐流媒体服务的搜索日志中抽样，涵盖了用户在搜索栏输入查询并在探索结果后，停留在编辑精选的播放列表上超过10分钟的案例。每个数据点都记录了用户的搜索查询、播放列表的标题和描述、用户以及与查询相关的播放列表曲目。这个数据集旨在解决自然语言音乐推荐中的挑战，通过整合多模态物品表示和用户长期偏好，为个性化音乐推荐提供更真实的工作基础。

提供机构：

Johannes Kepler University Linz, Austria and Deezer Research Paris, France

创建时间：

2025-07-22

搜集汇总

数据集介绍

构建方式

JAMSessions数据集的构建基于音乐流媒体服务的搜索日志，采集了为期一周的用户查询数据。每个数据点包含用户输入的搜索查询、编辑精选的播放列表标题和描述，以及用户最终收听的曲目。为了增强查询的多样性和上下文信息，研究团队利用DeepSeek-R1-Distill-Qwen-7B模型对原始查询进行扩展，生成更丰富的自然语言描述。数据集最终包含112,337个用户-查询-项目三元组，覆盖103,752个独立用户和99,865首独特曲目。

特点

JAMSessions数据集独特地融合了会话查询和用户长期偏好信号，为个性化音乐推荐研究提供了丰富资源。其显著特点包括：1) 结合了即时搜索意图（通过查询）和长期音乐偏好（通过用户历史行为）；2) 包含多模态项目特征，如音频、歌词和协同过滤信号；3) 查询经过语言模型增强，提高了表达的丰富性；4) 所有用户和项目都预计算了嵌入表示，便于研究使用。相较于现有音乐数据集，JAMSessions在同时捕捉用户即时需求和历史偏好方面具有明显优势。

使用方法

该数据集主要用于训练和评估自然语言音乐推荐系统。典型使用方式包括：1) 作为监督学习数据，训练模型预测给定用户和查询时的相关曲目；2) 评估多模态表示学习方法在音乐推荐中的效果；3) 研究长期用户偏好与即时查询的交互影响。研究人员可将用户嵌入、查询嵌入和项目多模态嵌入作为输入，采用翻译模型等架构学习三者关系。数据集还支持对比不同模态融合策略（如平均、交叉注意力）的效果研究。使用时需注意遵循数据匿名化处理原则，保护用户隐私。

背景与挑战

背景概述

JAMSessions数据集由Alessandro B. Melchiorre、Elena V. Epure等学者于2025年提出，旨在解决音乐推荐系统中自然语言接口与多模态数据融合的核心问题。该数据集包含超过10万条用户-查询-项目三元组，结合了匿名用户嵌入和编辑策划的播放列表数据，填补了现有数据集在捕捉用户长期偏好与即时搜索意图方面的空白。作为首个同时集成对话式查询和用户历史行为信号的数据集，JAMSessions为个性化音乐推荐研究提供了重要基准，其多模态特性（音频、歌词、协同过滤信号）进一步推动了跨模态表征学习在推荐系统中的应用。

当前挑战

JAMSessions面临的挑战主要体现在两方面：领域问题层面，需解决自然语言查询与多模态音乐项目间的语义对齐难题，例如用户输入"爱情歌曲"时需同时协调音频特征与歌词内容；构建过程层面，数据稀疏性和查询噪声（如简短重复的搜索词）迫使研究者采用LLM增强技术，但生成式扩充可能引入语义偏差。此外，平衡用户即时意图与长期偏好的动态建模，以及避免协同过滤信号在跨模态聚合中的主导效应，均为该数据集应用中的关键挑战。

常用场景

经典使用场景

在音乐推荐系统中，JAMSessions数据集被广泛应用于研究如何通过自然语言查询实现个性化音乐推荐。该数据集通过整合用户查询、长期偏好和多模态音乐特征，为研究者提供了一个理想的实验平台，用于探索如何将自然语言处理技术与推荐系统相结合。特别是在处理复杂查询如“适合夜晚驾驶的忧郁音乐”时，该数据集能够帮助模型理解用户意图并生成高度个性化的推荐结果。

解决学术问题

JAMSessions数据集解决了音乐推荐领域中的几个关键学术问题。首先，它填补了现有数据集中用户查询与长期偏好结合的空白，使得研究者能够更全面地建模用户行为。其次，通过多模态音乐特征（如音频、歌词和协同过滤信号）的整合，该数据集支持研究如何有效对齐复杂查询与音乐内容。此外，其轻量级的框架设计为实际部署中的计算效率和可扩展性提供了解决方案，推动了自然语言音乐推荐技术的实用化进程。

衍生相关工作

围绕JAMSessions数据集，已衍生出多项经典研究工作。例如，基于其翻译模型（TransE）思想扩展的跨模态注意力机制（CrossMixing），成为多模态音乐推荐的新范式。此外，数据集启发了对稀疏专家混合（MoEMixing）在推荐系统中应用的探索，为处理高维稀疏特征提供了新思路。这些工作不仅推动了音乐推荐领域的发展，也为其他垂直领域的自然语言交互推荐系统提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集