five

DISCO-10M|音乐数据集数据集|机器学习数据集

收藏
arXiv2023-10-05 更新2024-06-21 收录
音乐数据集
机器学习
下载链接:
https://huggingface.co/DISCOX
下载链接
链接失效反馈
资源简介:
DISCO-10M是由苏黎世联邦理工学院创建的大型音乐数据集,包含15296232条音乐数据,远超现有音乐数据集的规模。该数据集通过多阶段过滤过程确保数据质量,包括基于文本描述和音频嵌入的相似性。此外,数据集还提供了预计算的CLAP嵌入,便于直接应用于各种下游任务。DISCO-10M的目标是民主化和促进新研究,帮助推动音乐领域机器学习模型的创新发展。数据集内容丰富,覆盖多种音乐类型和来源,创建过程中采用了严格的筛选和匹配机制。应用领域广泛,旨在解决音乐分析、推荐系统和音乐创作中的问题。
提供机构:
苏黎世联邦理工学院
创建时间:
2023-06-23
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集