five

PRE_DB

收藏
Hugging Face2026-02-08 更新2026-02-09 收录
下载链接:
https://huggingface.co/datasets/leeyujun/PRE_DB
下载链接
链接失效反馈
官方服务:
资源简介:
DialBGM 是一个用于促进对话上下文理解和背景音乐推荐研究的数据集。该数据集专注于日常多轮对话场景,要求模型根据对话的上下文推理并选择合适的背景音乐。数据集包含 1,200 个精心挑选的样本,每个样本包括一个多轮对话、一组候选音乐片段及其文本元数据,以及一个排名标注,指示每个候选音乐对给定对话上下文的相对适合性。数据集支持对话感知音乐推荐和排名系统的基准测试与分析,以及语言和音乐描述之间的多模态推理研究。数据以 JSON 格式提供,每个样本包含对话摘要、对话轮次、音乐排名及候选音乐的详细信息(如名称、描述和音乐特征标签)。数据集适用于非商业用途,遵循 CC BY-NC-SA 4.0 许可。
创建时间:
2026-02-08
原始信息汇总

PRE_DB (DialBGM) 数据集概述

数据集基本信息

  • 数据集名称: DialBGM (PRE_DB)
  • 创建者: SLPR Lab / JoonHyeok Shin, Jaehoon Kang, Yu Jun Lee, Hanna Lee, Yejin Lee, Kyuhong Shim
  • 语言: 英语 (en)
  • 许可协议: CC BY-NC-SA 4.0
  • 数据规模: 1,200 个样本 (1K<n<10K)

数据集简介

DialBGM 是一个对话条件背景音乐推荐数据集,旨在促进对对话上下文理解和选择合适背景音乐的研究。该数据集专注于日常多轮对话场景,要求模型能够推理对话的演变上下文,并对多个候选音乐片段进行比较。

数据集用途

直接用途

该数据集可用于以下研究:

  • 为多轮对话选择合适音乐的模型的基准测试和评估。
  • 分析多轮对话上下文与音乐特征之间的关系。
  • 对文本(对话)和音乐元数据(描述和方面)进行多模态推理。

超出范围的用途

  • 由于采用 CC BY-NC-SA 4.0 许可协议,禁止任何商业用途

数据结构

数据集以 JSON 文件形式提供。每个样本是一个包含以下字段的 JSON 对象:

字段 类型 描述
id int 样本的唯一标识符。
dialog_one_liner string 对话的单行摘要。
dialog_turns list[string] 按时间顺序排列的、构成多轮对话的话语列表。
ranking list[string] 音乐键列表(例如 ["C", "D", "A", "B"]),表示候选音乐从最佳到最差的偏好顺序。
music dict 一组由键 ABCD 索引的候选音乐项。
music.name string 音乐片段的标识符(例如 [YouTubeID]-[start-end].wav)。
music.caption string 来自 MusicCaps 的音乐片段的文本描述。
music.aspect_list list[string] 描述音乐特征方面的标签列表。

数据来源

DialBGM 通过结合以下两个公共数据集创建:

  • DailyDialog (多轮对话来源,CC BY-NC-SA 4.0): https://huggingface.co/datasets/roskoN/dailydialog
  • MusicCaps (音乐描述和方面来源,CC BY-SA 4.0): https://huggingface.co/datasets/google/MusicCaps

来自 DailyDialog 的对话与来自 MusicCaps 的音乐元数据配对,并添加了排名注释以指示哪种音乐最适合每个对话上下文。

偏见、风险与局限性

  • 该数据集仅用于非商业用途,遵循从 DailyDialog 继承的 CC BY-NC-SA 4.0 许可协议。
  • 数据集继承了其源数据集 DailyDialog 和 MusicCaps 的偏见和覆盖范围限制。
  • 数据集规模相对较小,不适用于直接部署到生产或商业系统中

引用

如果此数据集对您的研究有帮助,请考虑引用:

@article{dialbgm2026, title = {DialBGM: A Dialogue-Conditioned Background Music Recommendation Dataset}, author = {SKKU SLPR Lab}, journal = {arXiv preprint arXiv:XXXX.XXXXX}, year = {2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在对话与音乐交叉研究领域,DialBGM数据集的构建体现了对多模态推理的系统性探索。该数据集通过整合DailyDialog的多轮对话语料与MusicCaps的音乐元数据,精心构建了1200个标注样本。每个样本均包含一段日常对话、一组候选音乐片段及其文本描述,并附有人工标注的排序标签,以指示各音乐片段与对话情境的匹配程度。这种构建方式不仅确保了数据来源的合法性与可追溯性,也为研究对话感知的音乐推荐提供了结构化的基准。
特点
DialBGM数据集的核心特点在于其对话条件化的音乐推荐设计。数据集中的每个样本均提供了多轮对话的完整上下文,以及四段候选音乐片段的详细元数据,包括文本描述与音乐特征标签。排序标注以偏好顺序呈现,使得数据集能够支持排序学习与对比分析任务。此外,数据集强调非商业用途,遵循CC BY-NC-SA 4.0许可,确保了学术研究的合规性,同时其规模适中,适合作为模型评估与多模态推理研究的实验平台。
使用方法
该数据集主要应用于对话感知背景音乐推荐的研究与评估。研究人员可通过加载JSON格式的数据文件,访问对话内容、音乐元数据及排序标签,构建模型以学习对话上下文与音乐特征之间的关联。典型的使用场景包括开发排序模型、进行多模态推理分析,或探究对话情感与音乐属性之间的映射关系。需要注意的是,数据集仅限非商业研究使用,且不应直接部署于生产系统,以符合其许可协议与设计初衷。
背景与挑战
背景概述
DialBGM数据集由SKKU SLPR实验室于2026年构建,旨在推动对话条件背景音乐推荐领域的研究。该数据集聚焦于日常多轮对话场景,通过整合DailyDialog的多轮对话语料与MusicCaps的音乐元数据,构建了包含1200个标注样本的基准资源。其核心研究问题在于探索如何基于动态演进的对话上下文,实现音乐片段的多模态推理与排序,从而弥补以往研究在长序列语境理解方面的不足。这一工作为多媒体人工智能领域提供了重要的实验平台,促进了对话感知音乐推荐系统的算法创新与评估。
当前挑战
DialBGM数据集致力于解决对话条件背景音乐推荐这一新兴任务的挑战,其核心难题在于如何建模多轮对话中隐含的情感、主题与氛围演变,并据此匹配具有相应声学特征的音乐片段。在构建过程中,研究人员面临双重挑战:一是需要设计有效的标注机制,以人工方式对音乐候选集进行主观性较强的适宜性排序,确保标注的一致性与可靠性;二是需协调不同源数据集(DailyDialog与MusicCaps)在内容分布与标注粒度上的差异,实现对话语境与音乐描述之间的语义对齐,同时受限于非商业许可,数据规模与覆盖范围较为有限。
常用场景
经典使用场景
在多媒体人工智能领域,DialBGM数据集为对话条件背景音乐推荐研究提供了基准平台。该数据集聚焦于日常多轮对话场景,要求模型依据对话的演进上下文,从多个候选音乐片段中推理并选择最适配的背景音乐。通过提供对话文本与音乐元数据的配对及排序标注,它支持对话感知音乐推荐系统的性能评估与分析,促进了语言与音乐跨模态推理的深入探索。
实际应用
在实际应用中,DialBGM数据集可服务于智能助手、虚拟社交伴侣及娱乐内容生成等场景。例如,在视频会议或在线聊天平台中,系统可根据对话情绪与主题自动匹配背景音乐,增强用户体验。此外,它还能辅助影视或游戏配乐创作,通过理解剧本对话的语境,生成或推荐契合情节发展的音乐,提升内容的情感表现力。
衍生相关工作
基于DialBGM数据集,已衍生出多项经典研究工作,主要集中在对话感知音乐推荐模型与跨模态排名算法上。例如,研究者利用该数据集训练神经网络,以融合对话表示与音乐特征,实现更精准的推荐排序。同时,一些工作探索了基于注意力机制的架构,以捕捉对话中的关键情感线索,进而优化音乐与语境的语义对齐,推动了多媒体推荐系统的技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作