five

FSD

收藏
github2019-07-27 更新2024-05-31 收录
下载链接:
https://github.com/zsscode/freesound-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
FSD是一个大规模、通用目的的数据集,由Freesound内容组成,并使用Google的AudioSet Ontology进行标注。

FSD is a large-scale, general-purpose dataset composed of Freesound content and annotated using Google's AudioSet Ontology.
创建时间:
2019-01-02
原始信息汇总

数据集概述

数据集名称

  • FSD

数据集内容

数据集特点

  • 通过Freesound Datasets平台创建。
  • 所有数据集将根据Creative Commons许可证公开可用。

数据集用途

  • 用于研究和开发,支持音频内容的探索和分析。

数据集创建参考文献

  • E. Fonseca, J. Pons, X. Favory, F. Font, D. Bogdanov, A. Ferraro, S. Oramas, A. Porter and X. Serra. “Freesound Datasets: A Platform for the Creation of Open Audio Datasets” In Proceedings of the 18th International Society for Music Information Retrieval Conference, Suzhou, China, 2017.
搜集汇总
数据集介绍
main_image_url
构建方式
FSD数据集的构建依托于Freesound平台的内容,通过人类标注的方式,对音频进行标签化处理,进而形成大规模、通用的音频数据集。该数据集以Google的AudioSet Ontology为标注体系,确保标注的一致性和准确性。
特点
FSD数据集的特点在于其开放性、协作性和规模性。它不仅包含了丰富多样的音频内容,还支持社区成员贡献标注信息,确保数据集的持续更新和完善。此外,所有数据集均遵循Creative Commons许可证,保证了数据的开放获取与共享。
使用方法
使用FSD数据集需要先安装docker和docker-compose。用户需配置项目凭证,并安装PostgreSQL的pg_trgm扩展以启用文本搜索功能。通过运行docker-compose命令,用户可以在本地启动FSD平台,并根据需要加载测试数据或生成模拟数据以进行开发和测试。
背景与挑战
背景概述
FSD数据集,全称为Freesound Datasets,是在Freesound平台基础上,通过众人协作创建的开放音频集合,这些音频被人类标注,并基于Google的AudioSet本体进行分类。该平台始建于2017年,由E. Fonseca, J. Pons, X. Favory等研究人员共同开发,旨在为音乐信息检索领域提供一个功能性的数据集平台,其影响力在音频处理和音乐信息检索领域不容小觑。
当前挑战
FSD数据集在构建过程中面临的主要挑战包括:确保音频样本的质量和多样性,以及标注的一致性和准确性。此外,如何鼓励社区参与,并维护一个活跃的标注和讨论环境,也是该平台面临的重要挑战。在技术层面,平台的扩展性、稳定性和用户界面的友好性也是不断优化和改进的方向。
常用场景
经典使用场景
Freesound Datasets平台作为音频数据集的集散地,其核心数据集FSD广泛用于音频识别与分类的研究。研究者通过探索FSD中丰富的音频样本,得以训练模型以识别不同的声音事件,从而促进音频信息检索及音乐信息检索领域的发展。
衍生相关工作
FSD数据集的发布促进了众多相关研究工作的发展,包括声音事件的自动标注、音频分割与转录等。此外,基于FSD的研究成果亦被广泛应用于音乐信息检索、环境声音监测等领域,推动了音频处理技术的进步。
数据集最近研究
最新研究方向
在音频处理与音乐信息检索领域,Freesound Datasets(FSD)平台近期的研究方向主要集中在构建大规模、通用的开放音频数据集。该数据集基于Freesound内容,并以Google的AudioSet Ontology进行标注,旨在推动音频识别、分类及标注技术的发展。近期研究聚焦于平台的持续开发与维护,以及通过社区协作优化数据集的质量和多样性。此研究方向不仅促进了音频数据集的透明化构建过程,也通过社区讨论的形式,加强了研究者在数据集标注任务协议、错误样本修正等方面的交流,进而为音频分析领域提供了重要资源,推动了相关研究的深入进行。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作