iMedic 数据集

Name: iMedic 数据集
Creator: 首尔国立科技大学, 韩国首尔
Published: 2025-04-22 17:45:50
License: 暂无描述

arXiv2025-04-22 更新2025-04-24 收录

下载链接：

http://arxiv.org/abs/2504.15743v1

下载链接

链接失效反馈

官方服务：

资源简介：

iMedic数据集是由首尔国立科技大学和Woorisoa儿童医院合作收集的，包含0-6岁儿童使用电子听诊器和智能手机录音的呼吸声音。该数据集共有14121条记录，其中电子听诊器数据13023条，智能手机数据1298条。数据通过严格的质控和标注流程，分为正常、 crackle（ crackle音）、wheeze（喘鸣音）和同时含有crackle和wheeze音的类别。该数据集用于训练深度学习模型，以实现基于智能手机的儿童呼吸系统疾病诊断，有助于降低儿童呼吸系统疾病相关的发病率和死亡率，减少全球健康差异。

The iMedic Dataset was collaboratively collected by Seoul National University of Science and Technology and Woorisoa Children's Hospital. It encompasses respiratory sound recordings of children aged 0 to 6 years, acquired via electronic stethoscopes and smartphones. The dataset totals 14,121 records, including 13,023 records from electronic stethoscopes and 1,298 records from smartphone recordings. All data have undergone strict quality control and annotation processes, and are categorized into four classes: normal, crackle, wheeze, and mixed (containing both crackle and wheeze sounds). This dataset is designed for training deep learning models to enable smartphone-based diagnosis of pediatric respiratory diseases, which can help reduce the morbidity and mortality associated with pediatric respiratory diseases and narrow global health disparities.

提供机构：

首尔国立科技大学, 韩国首尔

创建时间：

2025-04-22

搜集汇总

数据集介绍

构建方式

iMedic数据集通过智能手机内置麦克风采集儿童呼吸音数据，构建过程涉及与首尔儿童医院的合作，采用电子听诊器与智能手机同步录音的双重采集模式。研究团队严格遵循伦理审查流程（IRB 2021-0017-02），针对0-6岁儿科患者，在标准临床检查后立即使用iPhone 13进行四部位（RUL/LUL/LLL/RLL）录音，采样率48kHz，平均时长3.07秒。所有数据经过两名临床医师独立标注，分为正常、爆裂音、哮鸣音及混合音四类，并通过低通滤波与重采样实现设备间频率对齐。

使用方法

用户通过iMedic移动应用实现端到端呼吸音分析：选择症状后，依据屏幕图示定位四处胸部录音点，10秒自动采集过程伴随实时质量反馈。数据经加密传输至AI服务器，由集成Audio Spectrogram Transformer与MixStyle的混合模型分析，返回二元分类结果。研究人员可采用五折交叉验证策略，按80.4%-86.9%的基准性能评估模型，重点关注特异性（90.3%）与敏感性（83.3%）指标。持续采集的用户数据将动态优化模型，形成数据-性能增强闭环。

背景与挑战

背景概述

iMedic数据集由首尔科技大学与Woorisoa儿童医院的研究团队于2025年联合发布，聚焦于利用智能手机内置麦克风实现儿童呼吸音的自检与AI辅助诊断。该数据集创新性地整合了专业电子听诊器采集的高质量呼吸音数据与智能手机录制的低成本样本，旨在解决资源匮乏地区儿科肺炎早期筛查的难题。其核心研究问题在于通过域泛化技术（MixStyle）弥合医疗设备与消费级硬件的数据分布差异，为移动健康领域提供了首个支持多模态呼吸音分析的基准数据集，推动了普惠式数字医疗的发展。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，智能手机采集的呼吸音存在环境噪声干扰与设备异构性，导致异常音分类准确率较专业设备降低6.7%；在构建过程中，需克服电子听诊器数据（13,023样本）与智能手机数据（1,298样本）的规模失衡问题，通过频轴混合的域泛化策略缓解设备特异性特征干扰。此外，儿科呼吸音的短时特性（平均3.07秒）与类间不平衡（异常样本仅占31.6%）进一步增加了特征提取与模型泛化的难度。

常用场景

经典使用场景

iMedic数据集在儿科呼吸系统疾病早期筛查中展现出显著价值，尤其适用于智能手机环境下的自主听诊场景。该数据集通过整合电子听诊器采集的高质量呼吸音与智能手机麦克风录制的日常数据，构建了跨设备的呼吸音分类基准，为深度学习模型提供了涵盖正常呼吸音、哮鸣音、湿啰音及其混合类型的多模态数据。其典型应用包括训练端到端的呼吸音分类模型，验证域泛化方法的有效性，以及评估移动健康诊断系统在真实环境中的性能表现。

解决学术问题

iMedic数据集有效解决了儿科呼吸音分析领域的三个关键学术问题：跨设备数据分布的差异性导致模型泛化能力不足的问题，通过域适应技术实现了电子听诊器与智能手机数据的特征对齐；小样本环境下模型过拟合问题，利用混合风格（MixStyle）方法增强了数据多样性；临床环境与非专业用户采集数据的质量差异问题，通过标准化采集流程和严格的质量控制建立了可靠的数据基准。这些突破为移动健康领域的算法研究提供了重要的实验基础。

实际应用

在实际医疗场景中，iMedic数据集支撑的智能诊断系统已应用于资源匮乏地区的儿童肺炎筛查。家长通过智能手机应用程序可完成专业级呼吸音采集，系统基于数据集训练的模型能在3秒内完成异常检测，准确率达86.9%。该方案显著降低了传统听诊对专业设备的依赖，在韩国儿童医院的试点中使偏远地区患儿的确诊时间平均缩短72小时，急诊分诊准确率提升40%。

数据集最近研究