FSD

github2024-04-29 更新2024-05-31 收录

下载链接：

https://github.com/MTG/freesound-datasets

下载链接

链接失效反馈

官方服务：

资源简介：

通过Freesound Annotator创建的第一个数据集是FSD，这是一个大规模、通用目的的数据集，由Freesound内容组成，并使用Google的AudioSet Ontology进行标注。所有通过该平台收集的数据集都将以Creative Commons许可证公开提供。

The first dataset created through the Freesound Annotator is FSD, a large-scale, general-purpose dataset composed of Freesound content and annotated using Google's AudioSet Ontology. All datasets collected through this platform will be made publicly available under a Creative Commons license.

创建时间：

2017-03-14

原始信息汇总

数据集概述

数据集名称

FSD (Freesound Dataset)

数据集内容

由Freesound内容组成的大规模、通用目的音频数据集。
音频样本通过Google的AudioSet Ontology进行标注。

数据集特点

开放性：所有通过Freesound Annotator平台收集的数据集将根据Creative Commons许可证公开。
协作性：允许用户探索数据集内容，贡献标注，并下载不同时间戳版本的数据集。
讨论性：促进关于平台和数据集的讨论。

数据集创建工具

Freesound Annotator：一个基于Freesound内容的协作开放音频集合标注平台。

数据集使用

用户可以通过Freesound Annotator平台进行数据集的探索、贡献和下载。
鼓励社区成员参与讨论，包括但不限于音频样本的错误、错误的标注、标注任务协议等。

数据集文献

Fonseca, E., Pons, J., Favory, X., Font, F., Bogdanov, D., Ferraro, A., Oramas, S., Porter, A., & Serra, X. (2017). "Freesound Datasets: A Platform for the Creation of Open Audio Datasets". In Proceedings of the 18th International Society for Music Information Retrieval Conference, Suzhou, China.

搜集汇总

数据集介绍

构建方式

FSD数据集通过Freesound Annotator平台构建，该平台允许用户协作创建基于Freesound内容的开放音频数据集。数据集的构建过程包括从Freesound中提取音频内容，并使用Google的AudioSet Ontology进行标注。所有数据集均在Creative Commons许可下公开，确保了数据的可访问性和开放性。

特点

FSD数据集具有大规模和通用性的特点，涵盖了多种音频类别，适用于广泛的研究和应用场景。其标注基于Google的AudioSet Ontology，确保了标签的权威性和一致性。此外，数据集的开放性和社区参与性使其能够不断更新和扩展，适应不断变化的研究需求。

使用方法

使用FSD数据集需要先安装Docker和Docker Compose，然后通过配置文件设置相关参数。用户可以通过Django管理界面创建用户和数据集，并通过命令行工具加载测试数据和生成假数据。数据集的加载和使用过程透明且灵活，支持用户自定义数据集和标注任务，适合多种音频分析和处理任务。

背景与挑战

背景概述

FSD（Freesound Dataset）是由Freesound Annotator平台创建的一个大规模、通用目的的音频数据集，其内容来源于Freesound平台，并使用Google的AudioSet Ontology进行标注。该数据集的创建始于2017年，由E. Fonseca等研究人员在第18届国际音乐信息检索会议（ISMIR）上提出。FSD的构建旨在为音频分类、检索等任务提供一个开放且高质量的资源，推动音频信息处理领域的发展。通过众包方式进行标注，FSD不仅促进了社区的参与，还为音频领域的研究提供了丰富的实验数据。

当前挑战

FSD的构建过程中面临多项挑战。首先，音频数据的多样性和复杂性使得标注任务变得异常困难，尤其是在确保标注一致性和准确性方面。其次，众包模式下的标注质量控制是一个重要问题，如何有效管理社区贡献并筛选出高质量的标注数据是关键。此外，数据集的规模和多样性要求高效的存储和检索机制，以支持大规模的实验和应用。最后，确保数据集的开放性和可访问性，同时保护音频内容的版权和隐私，也是一项不容忽视的挑战。

常用场景

经典使用场景

FSD数据集在音频分类和标注任务中展现了其经典应用价值。该数据集通过整合Freesound平台的内容，并结合Google的AudioSet Ontology进行标注，为研究者提供了一个大规模、多标签的音频数据资源。其主要应用场景包括音频事件检测、声音分类以及音频检索等，这些任务在音频信息检索和机器学习领域具有重要意义。

衍生相关工作

基于FSD数据集，许多经典工作得以展开。例如，研究者利用该数据集开发了多种音频分类算法，提升了多标签音频分类的准确性。此外，FSD还启发了对音频事件检测和音频检索技术的深入研究，推动了相关领域的技术进步。学术界和工业界的合作也因FSD的开放性而得以加强，促进了音频数据集的标准化和共享。

数据集最近研究