CPJKU/openmic
收藏Hugging Face2023-11-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CPJKU/openmic
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由Spotify AB提供,遵循Creative Commons Attribution 4.0 International (CC BY 4.0)许可。数据集经过预处理和压缩,包含32khz的MP3文件,MP3文件的字节被嵌入其中。原始数据集包含10秒的音频片段、VGGish特征、MD5校验和、匿名个体响应、聚合标签、曲目元数据和样本分区等信息。
该数据集由Spotify AB提供,遵循Creative Commons Attribution 4.0 International (CC BY 4.0)许可。数据集经过预处理和压缩,包含32khz的MP3文件,MP3文件的字节被嵌入其中。原始数据集包含10秒的音频片段、VGGish特征、MD5校验和、匿名个体响应、聚合标签、曲目元数据和样本分区等信息。
提供机构:
CPJKU
原始信息汇总
数据集概述
数据集信息
特征
- filename: 文件名,数据类型为字符串。
- true: 序列,数据类型为float32,长度为20。
- mask: 序列,数据类型为int32,长度为20。
- mp3_bytes: MP3文件字节,数据类型为二进制。
数据分割
- train: 训练集,包含1790991884字节,14915个样本。
- test: 测试集,包含611455142字节,5085个样本。
数据大小
- download_size: 0字节
- dataset_size: 2402447026字节
配置
- config_name: default
- data_files:
- train: 路径为
data/shard_train_* - test: 路径为
data/shard_test_*
- train: 路径为
- data_files:
数据集描述
- 数据集由Spotify AB提供,使用Creative Commons Attribution 4.0 International (CC BY 4.0)许可证。
- 数据集预处理并压缩为32kHz的MP3文件,MP3文件字节嵌入。
- MP3字节可以使用例如PaSST或minimp3快速解码。
原始数据集内容
- 10秒音频片段,目录格式为
audio/{0:3}/{0}.ogg。 - VGGish特征,JSON对象,目录格式为
vggish/{0:3}/{0}.json。 - 每个OGG和JSON文件的MD5校验和。
- 匿名个人响应,文件为
openmic-2018-individual-responses.csv。 - 聚合标签,文件为
openmic-2018-aggregated-labels.csv。 - 轨道元数据,包含每个音频录音的许可证,文件为
openmic-2018-metadata.csv。 - Python友好的NPZ文件,包含特征和标签,文件为
openmic-2018.npz。 - 训练和测试样本分区,文件为
partitions/*.txt。
引用
Humphrey, Eric J., Durand, Simon, and McFee, Brian. "OpenMIC-2018: An Open Dataset for Multiple Instrument Recognition." in Proceedings of the 19th International Society for Music Information Retrieval Conference (ISMIR), 2018.
许可证
CC BY 4.0



