five

Infant Cry and Snoring Detection (ICSD) dataset|婴儿健康监测数据集|音频信号处理数据集

收藏
arXiv2024-08-20 更新2024-08-22 收录
婴儿健康监测
音频信号处理
下载链接:
https://github.com/QingyuLiu0521/ICSD/
下载链接
链接失效反馈
资源简介:
ICSD数据集是由上海师范大学智能教育与大数据上海工程技术研究中心创建,专门用于婴儿哭声和打鼾检测的研究。该数据集包含三种类型的子集:真实强标签子集、弱标签子集和合成强标签子集,共计9000条数据。数据集的创建过程包括从多个源数据集中提取和整合音频样本,并通过数据格式统一和清洗过程确保数据质量。ICSD数据集主要用于支持婴儿哭声和打鼾检测的研究,旨在提高家庭生活质量,改善婴儿护理,并为睡眠障碍的诊断和治疗提供支持。
提供机构:
上海师范大学智能教育与大数据上海工程技术研究中心
创建时间:
2024-08-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
ICSD数据集的构建方式独具匠心,它融合了三种不同类型的数据子集:真实强标签子集、弱标签子集和合成强标签子集。真实强标签子集由人工标注的事件级标签构成,弱标签子集仅包含剪辑级的标签,而合成强标签子集则是通过合成和标注生成的。为了确保数据集的多样性,研究人员从多个来源收集了音频样本,包括背景声音、婴儿哭声和打鼾声。这些数据经过清洗和格式统一,以满足ICSD系统的需求。合成强标签数据的生成则采用了Scaper工具包,通过概率定义来创建多样化的音频场景,并通过音高转换和时间拉伸等变换来操纵单个声音。
使用方法
ICSD数据集的使用方法多样,主要应用于婴儿哭声和打鼾声的检测研究。研究者可以利用数据集中的真实强标签子集和弱标签子集进行模型的训练和验证,以提高模型的准确性和泛化能力。此外,合成强标签子集可以用来增加训练数据的数量,从而提高模型的鲁棒性。在使用数据集时,研究者需要根据具体的研究目标和需求选择合适的数据子集。例如,对于需要进行事件级检测的研究,可以使用真实强标签子集;对于需要进行剪辑级检测的研究,可以使用弱标签子集;而对于需要大量训练数据的研究,可以使用合成强标签子集。
背景与挑战
背景概述
在音频信号处理领域,婴儿啼哭和打鼾事件的检测与分析是一项至关重要的任务。尽管现有的通用声音事件检测数据集已经非常丰富,但它们往往缺乏针对婴儿啼哭和打鼾的足够、强标签数据。为了提供一个基准数据集并促进婴儿啼哭和打鼾检测的研究,本文介绍了婴儿啼哭和打鼾检测(ICSD)数据集,这是一个新颖的、公开可用的数据集,专门为ICSD任务设计。ICSD包括三种类型的子集:一个具有基于事件的标签的手动注释的强标签子集,一个只有基于剪辑的事件注释的弱标签子集,以及一个由生成的合成子集,该子集具有强注释。本文详细描述了ICSD创建过程,包括遇到的挑战和采用的解决方案。我们提供了数据集的全面特征描述,讨论了其局限性和ICSD使用的关键因素。此外,我们在ICSD数据集上进行了广泛的实验,以建立基线系统,并提供在使用此数据集进行ICSD研究时的主要因素见解。我们的目标是开发一个将被社区广泛采用的数据集,作为未来ICSD研究的新的开放基准。
当前挑战
ICSD数据集面临的挑战包括:1)所解决的领域问题的挑战,即婴儿啼哭和打鼾检测的挑战;2)构建过程中所遇到的挑战,例如数据收集、数据清洗、数据格式统一、弱标签数据创建、真实强标签数据创建和合成强标签数据创建。这些挑战需要研究人员在数据集创建和模型训练过程中采取有效的解决方案,以提高模型的性能和泛化能力。
常用场景
经典使用场景
ICSD数据集经典使用场景描述:该数据集主要用于婴儿哭泣和打鼾声音事件的检测和分析。由于现有的数据集大多针对通用声音事件检测,缺乏针对婴儿哭泣和打鼾的足够标注数据,ICSD数据集的推出填补了这一空白。该数据集包含了三种子集:强标注子集、弱标注子集和合成子集,为研究人员提供了丰富的数据资源。在强标注子集中,事件级别的标注信息由人工手动标注,确保了数据的准确性。弱标注子集只包含剪辑级别的标注信息,适用于初步的模型训练和测试。合成子集则是通过生成和标注得到,提供了更多的数据量,有助于模型的泛化。这些特点使得ICSD数据集成为了婴儿哭泣和打鼾声音事件检测和分析的经典使用场景。
解决学术问题
ICSD数据集解决学术问题描述:该数据集解决了婴儿哭泣和打鼾声音事件检测和分析中数据资源不足的问题。现有的数据集要么规模太小,要么不适合婴儿哭泣和打鼾声音事件的研究。ICSD数据集的推出为研究人员提供了丰富的数据资源,有助于推动婴儿哭泣和打鼾声音事件检测和分析的研究。该数据集包含了三种子集:强标注子集、弱标注子集和合成子集,为研究人员提供了不同的标注方式和数据量,有助于解决学术研究中数据资源不足的问题。此外,ICSD数据集还提供了三个基准系统,为未来的研究提供了参考。
实际应用
ICSD数据集实际应用情况描述:ICSD数据集的实际应用场景主要集中在家居环境中。婴儿哭泣和打鼾声音事件的检测和分析对于家庭生活具有重要意义。婴儿哭泣是婴儿沟通的重要方式,能够反映婴儿的需求,如饥饿、不适或痛苦等。通过连续监测婴儿哭泣,父母可以及时响应,特别是在夜间睡眠时。打鼾是睡眠障碍的常见症状,如睡眠呼吸暂停,如果不及时治疗,可能导致严重的健康问题。定期检测和分析打鼾模式可以为医疗诊断和治疗提供有价值的参考。ICSD数据集的推出为家居环境中婴儿哭泣和打鼾声音事件的检测和分析提供了数据支持,有助于提高家庭生活质量,改善婴儿护理,促进睡眠障碍的诊断和治疗。
数据集最近研究
最新研究方向
随着人工智能在音频信号处理领域的深入发展,婴儿哭声和打鼾事件的检测与分析变得尤为重要。ICSD数据集的引入为这一领域的研究提供了强有力的支持。该数据集不仅包含了真实场景下的人工标注数据,还提供了弱标注和合成数据,为研究人员提供了多样化的训练和测试资源。目前,该数据集的最新研究方向主要集中在以下几个方面:首先,研究人员致力于提高模型在婴儿哭声和打鼾检测任务中的准确性和鲁棒性,特别是在噪声环境和复杂背景下的识别能力。其次,探索新的特征提取和模型训练方法,以更好地捕捉婴儿哭声和打鼾的声学特征,从而提高模型的识别性能。此外,结合其他生理信号(如心率、呼吸等)进行多模态分析,以提高对婴儿健康状况和睡眠质量的评估准确性,也是当前研究的热点之一。ICSD数据集的发布对于推动婴儿哭声和打鼾检测技术的发展具有重要意义,为研究人员提供了宝贵的实验数据和研究基础,有助于提高婴儿护理和家庭生活质量,促进睡眠障碍的诊断和治疗。
相关研究论文
  • 1
    ICSD: An Open-source Dataset for Infant Cry and Snoring Detection上海师范大学智能教育与大数据上海工程技术研究中心 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录