Meranti/CLAP_freesound
收藏Hugging Face2023-07-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Meranti/CLAP_freesound
下载链接
链接失效反馈官方服务:
资源简介:
LAION-Audio-630K是目前公开的最大的音频-文本数据集,包含了Freesound数据集。Hugging Face仓库中提供了两个版本的Freesound数据集:完整版和无重叠版。完整版包含所有Freesound数据,而无重叠版则移除了与ESC50、FSD50K、Urbansound8K和Clotho数据集重叠的样本。两个数据集都包含音频文件和1-2个对应的文本描述。元数据csv文件提供了音频文件名、描述、Freesound ID、上传者用户名、音频文件URL和许可信息。数据集的使用仅限于研究目的,商业用途需联系相关作者。
LAION-Audio-630K是目前公开的最大的音频-文本数据集,包含了Freesound数据集。Hugging Face仓库中提供了两个版本的Freesound数据集:完整版和无重叠版。完整版包含所有Freesound数据,而无重叠版则移除了与ESC50、FSD50K、Urbansound8K和Clotho数据集重叠的样本。两个数据集都包含音频文件和1-2个对应的文本描述。元数据csv文件提供了音频文件名、描述、Freesound ID、上传者用户名、音频文件URL和许可信息。数据集的使用仅限于研究目的,商业用途需联系相关作者。
提供机构:
Meranti
原始信息汇总
数据集概述
数据集名称
- LAION-Audio-630K Freesound Dataset
数据集版本
- Freesound (full): 完整数据集,包含515581个样本,总时长3033.38小时。
- Freesound (no overlap): 去除与ESC50, FSD50K, Urbansound8K和Clotho重叠的样本,包含460801个样本,总时长2817.31小时。
数据集特征
- 数据类型: 音频与文本
- 标签: 音频、文本、对比学习
- 语言: 英语
- 任务类别: 音频分类
- 大小类别: 1M<n<10M
数据集内容
- 音频文件: 包含1-2个文本描述的音频文件。
- 元数据: 提供CSV文件,包含音频文件名、文本描述、Freesound ID、上传者用户名、Freesound URL和许可证信息。
许可证信息
- 多数音频文件: 遵循Creative Commons许可证。
- 具体许可证分布:
- CC0: 260134个样本
- CC BY 4.0: 97090个样本
- CC BY 3.0: 89337个样本
- CC BY-NC 3.0: 31680个样本
- CC BY-NC 4.0: 26736个样本
- CC Sampling+ 1.0: 11116个样本
使用条款
- 限制: 仅限于研究目的使用。如需商业使用,请联系Frederic Font Corbera。
贡献者
- 组织: LAION,德国非营利研究组织。
- 社区贡献者: 包括但不限于Discord用户@marianna13#7139, @Chr0my#0173等。
搜集汇总
数据集介绍

背景与挑战
背景概述
Meranti/CLAP_freesound是一个大型音频-文本数据集,包含两个版本:完整版和去重叠版,主要用于音频分类和对比学习研究。数据集规模在100万到1000万之间,音频文件使用多种Creative Commons许可,仅限研究使用。
以上内容由遇见数据集搜集并总结生成



