Infant Cry and Snoring Detection (ICSD) dataset|婴儿健康监测数据集|音频信号处理数据集

arXiv2024-08-20 更新2024-08-22 收录

婴儿健康监测

音频信号处理

下载链接：

https://github.com/QingyuLiu0521/ICSD/

下载链接

链接失效反馈

资源简介：

ICSD数据集是由上海师范大学智能教育与大数据上海工程技术研究中心创建，专门用于婴儿哭声和打鼾检测的研究。该数据集包含三种类型的子集：真实强标签子集、弱标签子集和合成强标签子集，共计9000条数据。数据集的创建过程包括从多个源数据集中提取和整合音频样本，并通过数据格式统一和清洗过程确保数据质量。ICSD数据集主要用于支持婴儿哭声和打鼾检测的研究，旨在提高家庭生活质量，改善婴儿护理，并为睡眠障碍的诊断和治疗提供支持。

提供机构：

上海师范大学智能教育与大数据上海工程技术研究中心

创建时间：

2024-08-20

AI搜集汇总

数据集介绍

构建方式

ICSD数据集的构建方式独具匠心，它融合了三种不同类型的数据子集：真实强标签子集、弱标签子集和合成强标签子集。真实强标签子集由人工标注的事件级标签构成，弱标签子集仅包含剪辑级的标签，而合成强标签子集则是通过合成和标注生成的。为了确保数据集的多样性，研究人员从多个来源收集了音频样本，包括背景声音、婴儿哭声和打鼾声。这些数据经过清洗和格式统一，以满足ICSD系统的需求。合成强标签数据的生成则采用了Scaper工具包，通过概率定义来创建多样化的音频场景，并通过音高转换和时间拉伸等变换来操纵单个声音。

使用方法

ICSD数据集的使用方法多样，主要应用于婴儿哭声和打鼾声的检测研究。研究者可以利用数据集中的真实强标签子集和弱标签子集进行模型的训练和验证，以提高模型的准确性和泛化能力。此外，合成强标签子集可以用来增加训练数据的数量，从而提高模型的鲁棒性。在使用数据集时，研究者需要根据具体的研究目标和需求选择合适的数据子集。例如，对于需要进行事件级检测的研究，可以使用真实强标签子集；对于需要进行剪辑级检测的研究，可以使用弱标签子集；而对于需要大量训练数据的研究，可以使用合成强标签子集。

背景与挑战

背景概述

在音频信号处理领域，婴儿啼哭和打鼾事件的检测与分析是一项至关重要的任务。尽管现有的通用声音事件检测数据集已经非常丰富，但它们往往缺乏针对婴儿啼哭和打鼾的足够、强标签数据。为了提供一个基准数据集并促进婴儿啼哭和打鼾检测的研究，本文介绍了婴儿啼哭和打鼾检测（ICSD）数据集，这是一个新颖的、公开可用的数据集，专门为ICSD任务设计。ICSD包括三种类型的子集：一个具有基于事件的标签的手动注释的强标签子集，一个只有基于剪辑的事件注释的弱标签子集，以及一个由生成的合成子集，该子集具有强注释。本文详细描述了ICSD创建过程，包括遇到的挑战和采用的解决方案。我们提供了数据集的全面特征描述，讨论了其局限性和ICSD使用的关键因素。此外，我们在ICSD数据集上进行了广泛的实验，以建立基线系统，并提供在使用此数据集进行ICSD研究时的主要因素见解。我们的目标是开发一个将被社区广泛采用的数据集，作为未来ICSD研究的新的开放基准。

当前挑战

ICSD数据集面临的挑战包括：1)所解决的领域问题的挑战，即婴儿啼哭和打鼾检测的挑战；2)构建过程中所遇到的挑战，例如数据收集、数据清洗、数据格式统一、弱标签数据创建、真实强标签数据创建和合成强标签数据创建。这些挑战需要研究人员在数据集创建和模型训练过程中采取有效的解决方案，以提高模型的性能和泛化能力。

常用场景

经典使用场景

ICSD数据集经典使用场景描述：该数据集主要用于婴儿哭泣和打鼾声音事件的检测和分析。由于现有的数据集大多针对通用声音事件检测，缺乏针对婴儿哭泣和打鼾的足够标注数据，ICSD数据集的推出填补了这一空白。该数据集包含了三种子集：强标注子集、弱标注子集和合成子集，为研究人员提供了丰富的数据资源。在强标注子集中，事件级别的标注信息由人工手动标注，确保了数据的准确性。弱标注子集只包含剪辑级别的标注信息，适用于初步的模型训练和测试。合成子集则是通过生成和标注得到，提供了更多的数据量，有助于模型的泛化。这些特点使得ICSD数据集成为了婴儿哭泣和打鼾声音事件检测和分析的经典使用场景。

解决学术问题

ICSD数据集解决学术问题描述：该数据集解决了婴儿哭泣和打鼾声音事件检测和分析中数据资源不足的问题。现有的数据集要么规模太小，要么不适合婴儿哭泣和打鼾声音事件的研究。ICSD数据集的推出为研究人员提供了丰富的数据资源，有助于推动婴儿哭泣和打鼾声音事件检测和分析的研究。该数据集包含了三种子集：强标注子集、弱标注子集和合成子集，为研究人员提供了不同的标注方式和数据量，有助于解决学术研究中数据资源不足的问题。此外，ICSD数据集还提供了三个基准系统，为未来的研究提供了参考。

实际应用

ICSD数据集实际应用情况描述：ICSD数据集的实际应用场景主要集中在家居环境中。婴儿哭泣和打鼾声音事件的检测和分析对于家庭生活具有重要意义。婴儿哭泣是婴儿沟通的重要方式，能够反映婴儿的需求，如饥饿、不适或痛苦等。通过连续监测婴儿哭泣，父母可以及时响应，特别是在夜间睡眠时。打鼾是睡眠障碍的常见症状，如睡眠呼吸暂停，如果不及时治疗，可能导致严重的健康问题。定期检测和分析打鼾模式可以为医疗诊断和治疗提供有价值的参考。ICSD数据集的推出为家居环境中婴儿哭泣和打鼾声音事件的检测和分析提供了数据支持，有助于提高家庭生活质量，改善婴儿护理，促进睡眠障碍的诊断和治疗。

数据集最近研究

相关研究论文

1
ICSD: An Open-source Dataset for Infant Cry and Snoring Detection上海师范大学智能教育与大数据上海工程技术研究中心 · 2024年

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国区域地面气象要素驱动数据集 v2.0（1951-2024）

中国区域地面气象要素驱动数据集（China Meteorological Forcing Data，以下简称 CMFD）是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素，时间分辨率为 3 小时，水平空间分辨率为 0.1°，时间长度为 74 年（1951~2024 年），覆盖了 70°E~140°E，15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据，并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品，其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展，其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本，而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集，但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外，在制作 CMFD 2.0 的过程中，研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息，显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时，CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年，并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同，但其有效数据扩展到了中国之外，能够更好地支持跨境区域研究。为方便用户使用，CMFD 2.0 还在基础变量集之外提供了若干衍生变量，包括近地面相对湿度、雨雪分离降水产品等。此外，CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术，转而直接将实型数据压缩存储于 NetCDF4 格式文件中，从而消除了用户使用数据时进行解压换算的困扰。本数据集原定版本号为 1.7，但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变，故将其版本号重新定义为 2.0。

国家青藏高原科学数据中心收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据，包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态，适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建，包含5686张图像和45578个标签，重点关注六种行为：举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景，通过YOLOv5、YOLOv7和YOLOv8算法评估，平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础，解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

danaroth/whu_hi

WHU-Hi数据集（武汉无人机载高光谱图像）由武汉大学RSIDEA研究组收集和共享，可作为精确作物分类和高光谱图像分类研究的基准数据集。该数据集包含三个独立的无人机载高光谱数据集：WHU-Hi-LongKou、WHU-Hi-HanChuan和WHU-Hi-HongHu，均在中国湖北省的农业区域采集。这些数据集通过安装在无人机平台上的Headwall Nano-Hyperspec传感器获取，具有高空间分辨率（H2图像）。数据集预处理包括辐射校准和几何校正，使用仪器制造商提供的HyperSpec软件进行处理。每个数据集都包含了详细的采集时间、天气条件、传感器信息、飞行高度、图像尺寸、波段数量和空间分辨率等信息，并提供了不同作物类别的样本数量。

hugging_face 收录

DIOR

“DIOR” 是用于光学遥感图像中对象检测的大规模基准数据集，该数据集由23,463图像和带有水平边界框注释的192,518对象实例组成。

OpenDataLab 收录