five

google/MusicCaps|音乐分析数据集|音乐理解数据集

收藏
hugging_face2023-03-08 更新2024-03-04 收录
音乐分析
音乐理解
下载链接:
https://hf-mirror.com/datasets/google/MusicCaps
下载链接
链接失效反馈
资源简介:
MusicCaps数据集包含5,521个音乐示例,每个示例都带有英文的方面列表和由音乐家撰写的自由文本描述。这些描述专注于音乐的声音特征,而不是元数据如艺术家名称。数据集以.csv文件形式发布,包含YouTube视频的ID及其开始/结束时间戳。使用该数据集需要下载相应的YouTube视频并根据时间戳进行剪辑。
提供机构:
google
原始信息汇总

数据集卡片 for MusicCaps

数据集描述

数据集概述

MusicCaps 数据集包含 5,521 个音乐示例,每个示例都标有英语的 aspect list 和由音乐家编写的 free text caption。例如,aspect list 可能是 "pop, tinny wide hi hats, mellow piano melody, high pitched female vocal melody, sustained pulsating synth lead",而 caption 则由多句话组成,描述音乐的声音,例如:

"A low sounding male voice is rapping over a fast paced drums playing a reggaeton beat along with a bass. Something like a guitar is playing the melody along. This recording is of poor audio-quality. In the background a laughter can be noticed. This song may be playing in a bar."

这些标注示例是从 AudioSet 数据集中提取的 10 秒音乐片段(2,858 来自 eval 分割,2,663 来自 train 分割)。

数据集使用

发布的数据集以 .csv 文件的形式存在,包含 YouTube 视频的 ID 及其开始/结束时间戳。使用此数据集需要下载相应的 YouTube 视频,并根据开始/结束时间进行分割。

支持的任务和排行榜

[更多信息需要]

语言

[更多信息需要]

数据集结构

数据实例

[更多信息需要]

数据字段

  • ytid: 指向包含标注音乐片段的 YouTube 视频的 YT ID。可以通过打开 https://youtu.be/watch?v={ytid}&start={start_s} 来收听片段。
  • start_s: 音乐在 YouTube 视频中开始的位置。
  • end_s: 音乐在 YouTube 视频中结束的位置。所有片段都是 10 秒长。
  • audioset_positive_labels: 来自 AudioSet (https://research.google.com/audioset/) 数据集的此片段的标签。
  • aspect_list: 描述音乐的 aspect list。
  • caption: 描述音乐的多句自由文本 caption。
  • author_id: 用于按编写者分组样本的整数。
  • is_balanced_subset: 如果此值为 true,则该行是按流派平衡的 1k 子集的一部分。
  • is_audioset_eval: 如果此值为 true,则该片段来自 AudioSet eval 分割。否则来自 AudioSet train 分割。

数据分割

[更多信息需要]

数据集创建

策划理由

[更多信息需要]

源数据

初始数据收集和规范化

[更多信息需要]

源语言生产者是谁?

[更多信息需要]

注释

注释过程

[更多信息需要]

注释者是谁?

[更多信息需要]

个人和敏感信息

[更多信息需要]

使用数据集的注意事项

数据集的社会影响

[更多信息需要]

偏见的讨论

[更多信息需要]

其他已知限制

[更多信息需要]

附加信息

数据集策展人

此数据集由 @googleai 分享。

许可信息

此数据集的许可为 cc-by-sa-4.0。

引用信息

bibtex [更多信息需要]

贡献

[更多信息需要]

AI搜集汇总
数据集介绍
main_image_url
构建方式
MusicCaps数据集的构建基于AudioSet数据集,精选了其中的5,521个10秒音乐片段,并由专业音乐人对其进行标注。每个音乐片段不仅附有详细的英语描述列表(aspect list),还包含一段自由文本的描述(caption),专注于音乐的听觉特征而非元数据。这些标注旨在捕捉音乐的细微听觉差异,为音乐分析和生成模型提供了丰富的训练数据。
特点
MusicCaps数据集的显著特点在于其精细的标注方式和多样化的音乐描述。每个音乐片段都配备了专业的听觉描述,涵盖了音乐的多个维度,如节奏、音色和旋律等。此外,数据集还提供了音频片段在YouTube视频中的起止时间,便于用户直接获取原始音频数据。这种结构化的标注方式使得该数据集在音乐生成、分析和理解任务中具有广泛的应用潜力。
使用方法
使用MusicCaps数据集时,用户需首先下载对应的YouTube视频,并根据提供的起止时间截取10秒的音频片段。数据集以.csv文件形式发布,包含YouTube视频ID、起止时间、AudioSet标签、音乐描述列表及自由文本描述等字段。用户可通过提供的示例脚本和Notebook加载数据,并利用Gradio演示探索样本。该数据集适用于音乐生成、描述生成等任务,为研究者提供了丰富的音乐特征描述数据。
背景与挑战
背景概述
MusicCaps数据集由Google AI团队发布,包含5,521个音乐样本,每个样本都附有英语的方面列表和由音乐家撰写的自由文本描述。该数据集的核心研究问题在于通过详细的文本描述来捕捉音乐的听觉特征,而非依赖于艺术家名称等元数据。这些样本来源于AudioSet数据集,涵盖了从评估集和训练集中提取的10秒音乐片段。MusicCaps的创建旨在为音乐描述和生成模型提供丰富的训练数据,推动文本到语音合成等领域的研究进展。
当前挑战
MusicCaps数据集在构建过程中面临多项挑战。首先,如何从AudioSet中筛选出具有代表性的音乐片段,并确保这些片段能够准确反映音乐的多样性,是一个复杂的问题。其次,音乐的描述需要专业音乐家的参与,确保描述的准确性和丰富性,这增加了数据集构建的难度和成本。此外,数据集的标注过程中可能引入的偏见,如特定音乐风格或文化背景的偏好,也是需要解决的问题。最后,数据集的使用需要下载和处理YouTube视频,这增加了数据获取和处理的复杂性。
常用场景
经典使用场景
MusicCaps数据集的经典使用场景主要集中在音乐描述生成与理解领域。通过该数据集,研究者可以训练模型以生成或理解音乐片段的详细描述,包括音乐的风格、乐器使用、声音特征等。例如,模型可以学习从音乐片段中提取出‘流行音乐,带有清脆的宽广高帽,柔和的钢琴旋律,高音女声旋律,持续的脉动合成器主音’等描述性信息。
解决学术问题
MusicCaps数据集解决了音乐信息处理领域中音乐描述生成与理解的学术问题。传统上,音乐数据的描述依赖于元数据,如艺术家名称或专辑信息,而该数据集通过提供详细的音乐声音描述,使得研究者能够专注于音乐本身的声学特征。这不仅提升了音乐描述的准确性,还为音乐情感分析、风格分类等研究提供了新的视角和方法。
衍生相关工作
基于MusicCaps数据集,研究者已开展了多项相关工作,包括音乐描述生成模型的优化、音乐情感分析的深度学习方法以及音乐风格迁移的研究。这些工作不仅推动了音乐信息处理技术的发展,还为音乐教育和音乐治疗等领域提供了新的应用工具。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

Global Livestock Geo-Wiki

Global Livestock Geo-Wiki是一个全球牲畜分布数据集,旨在提供全球范围内牲畜分布的详细信息。该数据集包括不同类型的牲畜(如牛、羊、猪等)的分布情况,以及相关的环境和社会经济数据。

livestock.geo-wiki.org 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录