HF_Lung_V1

arXiv2022-07-12 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2102.03049v3

下载链接

链接失效反馈

官方服务：

资源简介：

HF_Lung_V1是一个包含9,765个肺声音频文件的数据库，每个文件时长15秒，包含34,095个吸气标签、18,349个呼气标签、13,883个连续异常声音标签（包括8,457个喘鸣标签、686个喉鸣标签和4,740个哮鸣标签）以及15,606个间断异常声音标签（均为爆裂音）。

HF_Lung_V1 is a database consisting of 9,765 lung sound audio files, each with a duration of 15 seconds. It contains 34,095 inspiratory labels, 18,349 expiratory labels, 13,883 continuous abnormal sound labels (including 8,457 wheeze labels, 686 stridor labels, and 4,740 rhonchi labels), as well as 15,606 intermittent abnormal sound labels (all crackles).

创建时间：

2021-02-05

搜集汇总

数据集介绍

构建方式

HF_Lung_V1数据集由两部分数据源组成。首先，来自台湾智能紧急和重症监护（TSECC）2020数据挑战的数据集，该数据集在知识共享署名4.0（CC BY 4.0）许可下提供。其次，来自台湾北部一家呼吸护理病房（RCW）或呼吸护理中心（RCC）的居民在2018年8月至2019年10月期间录制的声音。所有录音均使用两种设备进行：Littmann 3200商用电子听诊器和定制的多通道声学记录设备（HF-Type-1），该设备支持连接八个驻极体麦克风。录音后，使用高通过滤器消除60赫兹的电气干扰和部分心脏声音噪声。随后，应用短时傅里叶变换（STFT）对信号进行处理，并提取梅尔频率倒谱系数（MFCCs）、能量累加等特征。最后，将所有特征连接起来形成特征矩阵，并进行归一化处理。

特点

HF_Lung_V1数据集包含9765个音频文件，每个音频文件的时长为15秒，共有34095个吸气标签、18349个呼气标签、13883个连续异常声音标签（包括8457个喘鸣标签、686个喉鸣标签和4740个鼾声标签）以及15606个不连续异常声音标签（均为爆裂音）。该数据集具有以下特点：数据量庞大，覆盖了多种呼吸声音和异常声音类型；音频文件长度固定，便于模型训练和评估；标签详细，包括吸气、呼气、喘鸣、喉鸣、鼾声和不连续异常声音。

使用方法

HF_Lung_V1数据集可用于训练和评估呼吸声音分析模型，包括吸气、呼气、连续异常声音和不连续异常声音检测。使用该数据集时，首先需要进行数据预处理，包括信号处理和特征提取。然后，可以使用深度学习模型进行训练和评估，例如长短时记忆网络（LSTM）、门控循环单元（GRU）、双向LSTM（BiLSTM）、双向GRU（BiGRU）、卷积神经网络（CNN）-LSTM、CNN-GRU、CNN-BiLSTM和CNN-BiGRU。最后，对模型进行后处理，包括合并相邻段预测结果和消除爆发事件。

背景与挑战

背景概述

HF_Lung_V1数据集是由台湾大学、台北远东纪念医院等机构的研究人员开发的，旨在克服传统听诊法的主观性和局限性。该数据集包含9765个音频文件，每个文件时长为15秒，共计34,095个吸气标签、18,349个呼气标签、13,883个连续杂音标签（包括8457个喘鸣标签、686个喘鸣标签和4740个罗音标签）以及15,606个非连续杂音标签（均为爆裂音）。HF_Lung_V1数据集的创建填补了呼吸音分析领域的空白，为深度学习算法的训练提供了大量高质量数据，对呼吸系统疾病的诊断和监测具有重要意义。

当前挑战

HF_Lung_V1数据集面临的挑战主要包括：1)呼吸音分析领域的问题，如呼吸音模式异常、数据不平衡、信噪比低、标签噪声和呼吸音重叠等；2)构建过程中遇到的挑战，如呼吸音记录设备的差异、音频文件的截断和标签的建立等。为了解决这些挑战，未来的研究可以探索更先进的深度学习模型、区域卷积神经网络和波let变换等方法，以提高呼吸音分析模型的准确性和鲁棒性。

常用场景

经典使用场景

HF_Lung_V1数据集在呼吸声分析领域的经典使用场景包括呼吸相检测和异常呼吸声（如哮鸣音、喘鸣音和鼾音）检测。该数据集包含大量的肺部呼吸声音频文件，以及相应的吸气、呼气、连续异常呼吸声和间断异常呼吸声的标签。通过使用深度学习方法，如长短期记忆网络（LSTM）、门控循环单元（GRU）和卷积神经网络（CNN），研究人员可以利用HF_Lung_V1数据集训练模型，从而实现自动化的呼吸声分析。这些模型可以用于实时监测患者的呼吸状况，并在临床场景中辅助医生进行呼吸系统疾病的诊断和病情监测。

衍生相关工作

HF_Lung_V1数据集的建立和研究成果为后续研究提供了重要的参考和启示。例如，后续研究可以探索使用更先进的卷积神经网络（CNN）结构，如区域CNN变体，以进一步提高模型的性能。此外，还可以研究小波变换、经验模态分解等方法，以提取不同的特征信息，从而提高模型的鲁棒性和准确性。此外，还可以探索将气管呼吸声分析技术集成到呼吸监测设备中，以实现更全面的呼吸系统监测。这些衍生工作将有助于推动呼吸声分析领域的发展，并为临床应用提供更好的技术支持。

数据集最近研究