hdparmar/irish-traditional-tunes
收藏Hugging Face2023-10-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hdparmar/irish-traditional-tunes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为irish-traditional-tunes,主要用于音乐分析、机器学习和人工智能领域。数据集包含9604个Mel频谱图,这些频谱图代表了爱尔兰传统音乐。每个频谱图是5秒音频的分割,尺寸为512x512,并包含3个通道(模仿RGB),因为大多数文本到图像模型都是在3个通道上训练的。数据集的结构包括图像和文本描述,其中文本描述统一为An Irish Traditional Tune。数据集目前仅包含训练集,未来可能会引入验证集或测试集。
提供机构:
hdparmar
原始信息汇总
数据集卡片 for "irish-traditional-tunes"
1. 数据集描述
1.1 数据集概述
该数据集包含9604个梅尔频谱图,代表传统爱尔兰音乐。与hdparmar/irish-tunes-spectrogram相比,该数据集较小,以减少训练时间和增加训练更长步数/批次的可能性。每个频谱图图像是一个5秒的音频片段,尺寸为512x512,包含3个通道(模仿RGB),因为大多数文本到图像模型都是在3个通道上训练的。
1.2 语言
数据集的元数据和文档均为英语,确保了可访问性和理解性。
2. 数据集结构
2.1 数据实例
该数据集中的每个数据实例由两个主要元素组成:一个图像和一个文本描述。图像是一个梅尔频谱图,反映了一段传统爱尔兰曲调的片段。伴随它的是一个文本字段,作为其描述。
示例:
数据集的metadata.csv文件格式如下:
{"file_name": "path/to/the/image.png", "text": "An Irish Traditional Tune"}
2.2 数据字段
- file_name: 包含图像文件路径的字段,指示了数据集每个部分的特定位置。
- text: 伴随每个图像的描述。为了统一和方便,每个图像的描述都是"An Irish Traditional Tune"。
2.3 数据分割
目前版本的数据集仅包含一个训练分割。未来的迭代可能会引入验证或测试分割。
2.4 统一描述:特别说明
该数据集中所有频谱图都带有统一的描述:"An Irish Traditional Tune"。
这种一致性可能在主要关注图像特征的文本到图像任务中特别有利,描述作为通用标签。



