PRE_DB

Hugging Face2026-02-08 更新2026-02-09 收录

下载链接：

https://huggingface.co/datasets/leeyujun/PRE_DB

下载链接

链接失效反馈

官方服务：

资源简介：

DialBGM 是一个用于促进对话上下文理解和背景音乐推荐研究的数据集。该数据集专注于日常多轮对话场景，要求模型根据对话的上下文推理并选择合适的背景音乐。数据集包含 1,200 个精心挑选的样本，每个样本包括一个多轮对话、一组候选音乐片段及其文本元数据，以及一个排名标注，指示每个候选音乐对给定对话上下文的相对适合性。数据集支持对话感知音乐推荐和排名系统的基准测试与分析，以及语言和音乐描述之间的多模态推理研究。数据以 JSON 格式提供，每个样本包含对话摘要、对话轮次、音乐排名及候选音乐的详细信息（如名称、描述和音乐特征标签）。数据集适用于非商业用途，遵循 CC BY-NC-SA 4.0 许可。

创建时间：

2026-02-08

原始信息汇总

PRE_DB (DialBGM) 数据集概述

数据集基本信息

数据集名称: DialBGM (PRE_DB)
创建者: SLPR Lab / JoonHyeok Shin, Jaehoon Kang, Yu Jun Lee, Hanna Lee, Yejin Lee, Kyuhong Shim
语言: 英语 (en)
许可协议: CC BY-NC-SA 4.0
数据规模: 1,200 个样本 (1K<n<10K)

数据集简介

DialBGM 是一个对话条件背景音乐推荐数据集，旨在促进对对话上下文理解和选择合适背景音乐的研究。该数据集专注于日常多轮对话场景，要求模型能够推理对话的演变上下文，并对多个候选音乐片段进行比较。

数据集用途

直接用途

该数据集可用于以下研究：

为多轮对话选择合适音乐的模型的基准测试和评估。
分析多轮对话上下文与音乐特征之间的关系。
对文本（对话）和音乐元数据（描述和方面）进行多模态推理。

超出范围的用途

由于采用 CC BY-NC-SA 4.0 许可协议，禁止任何商业用途。

数据结构

数据集以 JSON 文件形式提供。每个样本是一个包含以下字段的 JSON 对象：

字段	类型	描述
`id`	int	样本的唯一标识符。
`dialog_one_liner`	string	对话的单行摘要。
`dialog_turns`	list[string]	按时间顺序排列的、构成多轮对话的话语列表。
`ranking`	list[string]	音乐键列表（例如 `["C", "D", "A", "B"]`），表示候选音乐从最佳到最差的偏好顺序。
`music`	dict	一组由键 `A`、`B`、`C` 和 `D` 索引的候选音乐项。
`music.name`	string	音乐片段的标识符（例如 `[YouTubeID]-[start-end].wav`）。
`music.caption`	string	来自 MusicCaps 的音乐片段的文本描述。
`music.aspect_list`	list[string]	描述音乐特征方面的标签列表。

数据来源

DialBGM 通过结合以下两个公共数据集创建：

DailyDialog (多轮对话来源，CC BY-NC-SA 4.0): https://huggingface.co/datasets/roskoN/dailydialog
MusicCaps (音乐描述和方面来源，CC BY-SA 4.0): https://huggingface.co/datasets/google/MusicCaps

来自 DailyDialog 的对话与来自 MusicCaps 的音乐元数据配对，并添加了排名注释以指示哪种音乐最适合每个对话上下文。

偏见、风险与局限性

该数据集仅用于非商业用途，遵循从 DailyDialog 继承的 CC BY-NC-SA 4.0 许可协议。
数据集继承了其源数据集 DailyDialog 和 MusicCaps 的偏见和覆盖范围限制。
数据集规模相对较小，不适用于直接部署到生产或商业系统中。

引用

如果此数据集对您的研究有帮助，请考虑引用：

@article{dialbgm2026, title = {DialBGM: A Dialogue-Conditioned Background Music Recommendation Dataset}, author = {SKKU SLPR Lab}, journal = {arXiv preprint arXiv:XXXX.XXXXX}, year = {2026} }

搜集汇总

数据集介绍

构建方式

在对话与音乐交叉研究领域，DialBGM数据集的构建体现了对多模态推理的系统性探索。该数据集通过整合DailyDialog的多轮对话语料与MusicCaps的音乐元数据，精心构建了1200个标注样本。每个样本均包含一段日常对话、一组候选音乐片段及其文本描述，并附有人工标注的排序标签，以指示各音乐片段与对话情境的匹配程度。这种构建方式不仅确保了数据来源的合法性与可追溯性，也为研究对话感知的音乐推荐提供了结构化的基准。

特点

DialBGM数据集的核心特点在于其对话条件化的音乐推荐设计。数据集中的每个样本均提供了多轮对话的完整上下文，以及四段候选音乐片段的详细元数据，包括文本描述与音乐特征标签。排序标注以偏好顺序呈现，使得数据集能够支持排序学习与对比分析任务。此外，数据集强调非商业用途，遵循CC BY-NC-SA 4.0许可，确保了学术研究的合规性，同时其规模适中，适合作为模型评估与多模态推理研究的实验平台。

使用方法

该数据集主要应用于对话感知背景音乐推荐的研究与评估。研究人员可通过加载JSON格式的数据文件，访问对话内容、音乐元数据及排序标签，构建模型以学习对话上下文与音乐特征之间的关联。典型的使用场景包括开发排序模型、进行多模态推理分析，或探究对话情感与音乐属性之间的映射关系。需要注意的是，数据集仅限非商业研究使用，且不应直接部署于生产系统，以符合其许可协议与设计初衷。

背景与挑战

背景概述

DialBGM数据集由SKKU SLPR实验室于2026年构建，旨在推动对话条件背景音乐推荐领域的研究。该数据集聚焦于日常多轮对话场景，通过整合DailyDialog的多轮对话语料与MusicCaps的音乐元数据，构建了包含1200个标注样本的基准资源。其核心研究问题在于探索如何基于动态演进的对话上下文，实现音乐片段的多模态推理与排序，从而弥补以往研究在长序列语境理解方面的不足。这一工作为多媒体人工智能领域提供了重要的实验平台，促进了对话感知音乐推荐系统的算法创新与评估。

当前挑战

DialBGM数据集致力于解决对话条件背景音乐推荐这一新兴任务的挑战，其核心难题在于如何建模多轮对话中隐含的情感、主题与氛围演变，并据此匹配具有相应声学特征的音乐片段。在构建过程中，研究人员面临双重挑战：一是需要设计有效的标注机制，以人工方式对音乐候选集进行主观性较强的适宜性排序，确保标注的一致性与可靠性；二是需协调不同源数据集（DailyDialog与MusicCaps）在内容分布与标注粒度上的差异，实现对话语境与音乐描述之间的语义对齐，同时受限于非商业许可，数据规模与覆盖范围较为有限。

常用场景

经典使用场景

在多媒体人工智能领域，DialBGM数据集为对话条件背景音乐推荐研究提供了基准平台。该数据集聚焦于日常多轮对话场景，要求模型依据对话的演进上下文，从多个候选音乐片段中推理并选择最适配的背景音乐。通过提供对话文本与音乐元数据的配对及排序标注，它支持对话感知音乐推荐系统的性能评估与分析，促进了语言与音乐跨模态推理的深入探索。

实际应用

在实际应用中，DialBGM数据集可服务于智能助手、虚拟社交伴侣及娱乐内容生成等场景。例如，在视频会议或在线聊天平台中，系统可根据对话情绪与主题自动匹配背景音乐，增强用户体验。此外，它还能辅助影视或游戏配乐创作，通过理解剧本对话的语境，生成或推荐契合情节发展的音乐，提升内容的情感表现力。

衍生相关工作

基于DialBGM数据集，已衍生出多项经典研究工作，主要集中在对话感知音乐推荐模型与跨模态排名算法上。例如，研究者利用该数据集训练神经网络，以融合对话表示与音乐特征，实现更精准的推荐排序。同时，一些工作探索了基于注意力机制的架构，以捕捉对话中的关键情感线索，进而优化音乐与语境的语义对齐，推动了多媒体推荐系统的技术进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集