ICSD|音频事件检测数据集|婴儿哭声与打鼾数据集
收藏ICSD: An Open-source Dataset for Infant Cry and Snoring Detection
数据集概述
ICSD 是一个用于婴儿哭声和打鼾检测的综合音频事件数据集,具有以下特点:
- 包含超过 3.3 小时的强标签数据和 1 小时的弱标签数据;
- 包含前景事件和背景事件,用于生成合成数据。
数据结构
数据集的音频文件存储在 audio 文件夹中,事件时间戳注释存储在 metadata 文件夹中,每个文件夹进一步分为训练、验证和测试子文件夹。此外,还提供了用于生成合成强标签数据的源材料。可以使用 Scaper 生成自己的合成数据。
数据预览
demo 文件夹提供了四个可供下载和试听的音频样本。
基线系统
基线系统基于 DCASE 2023 Challenge 任务4设计,提供了三种基线:
- 仅使用合成数据的基线
- 使用真实数据和合成数据的基线
- 使用预训练嵌入的基线
使用方法
- 数据下载:从 HuggingFace 下载数据集并解压到
data文件夹。 - 训练:
- 仅使用合成数据的基线:
python train_sed.py - 使用真实数据和合成数据的基线:
python train_sed.py --strong_real - 使用预训练嵌入的基线:先预计算嵌入:
python extract_embeddings.py --output_dir ./embeddings --pretrained_model "beats",然后运行系统:train_pretrained.py
- 仅使用合成数据的基线:
引用
如果使用 ICSD 数据集,请引用以下论文: bibtex @article{ICSD, title={ICSD: An Open-source Dataset for Infant Cry and Snoring Detection}, author={Qingyu Liu, Longfei Song, Dongxing Xu, Yanhua Long}, journal={arXiv}, volume={} year={2024} }

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
