DISCO-10M|音乐数据集数据集|机器学习数据集
收藏arXiv2023-10-05 更新2024-06-21 收录
下载链接:
https://huggingface.co/DISCOX
下载链接
链接失效反馈资源简介:
DISCO-10M是由苏黎世联邦理工学院创建的大型音乐数据集,包含15296232条音乐数据,远超现有音乐数据集的规模。该数据集通过多阶段过滤过程确保数据质量,包括基于文本描述和音频嵌入的相似性。此外,数据集还提供了预计算的CLAP嵌入,便于直接应用于各种下游任务。DISCO-10M的目标是民主化和促进新研究,帮助推动音乐领域机器学习模型的创新发展。数据集内容丰富,覆盖多种音乐类型和来源,创建过程中采用了严格的筛选和匹配机制。应用领域广泛,旨在解决音乐分析、推荐系统和音乐创作中的问题。
提供机构:
苏黎世联邦理工学院
创建时间:
2023-06-23
