BUET Multi-disease Heart Sound (BMD-HS) Dataset
收藏arXiv2024-09-01 更新2024-09-06 收录
下载链接:
https://github.com/mHealthBuet/BMD-HS-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
BUET Multi-disease Heart Sound (BMD-HS) Dataset是由孟加拉国工程技术大学的mHealth实验室精心策划的心音记录数据集,包含864条记录,涵盖五种常见心脏声音类别,代表多种瓣膜心脏疾病。数据集的显著特点是其创新的多标签注释系统,能够捕捉多种疾病和独特的疾病状态,极大地增强了数据集在开发高级机器学习模型中的实用性。数据集的创建过程标准化,确保了数据的一致性和可靠性,并通过超声心动图验证了患者状况,增强了数据集的可信度。该数据集主要应用于心血管疾病的诊断和管理,旨在通过数据驱动的诊断方法提高心脏健康研究的准确性和一致性。
BUET Multi-disease Heart Sound (BMD-HS) Dataset is a meticulously curated phonocardiogram recording dataset developed by the mHealth Laboratory at Bangladesh University of Engineering and Technology (BUET). It contains 864 records covering five common heart sound categories, representing a spectrum of valvular heart diseases. A prominent feature of this dataset is its innovative multi-label annotation system, which can capture multiple comorbidities and unique disease states, greatly enhancing its utility for developing advanced machine learning models. The dataset was constructed with standardized procedures to ensure data consistency and reliability, and patient conditions were validated via echocardiography to further improve its credibility. This dataset is primarily applied to the diagnosis and management of cardiovascular diseases, aiming to elevate the accuracy and consistency of cardiac health research through data-driven diagnostic approaches.
提供机构:
孟加拉国工程技术大学
创建时间:
2024-09-01
搜集汇总
数据集介绍

构建方式
BUET Multi-disease Heart Sound (BMD-HS) 数据集的构建是通过从心脏手术病房收集数据,包括来自不同年龄和性别的患者。所有受试者的心脏状况均通过超声心动图得到证实。数据收集使用临床级数字听诊器的隔膜模式,并通过蓝牙连接到笔记本电脑。数据以坐位和仰卧位从四个主要听诊部位进行记录:二尖瓣部位、三尖瓣部位、肺动脉瓣部位和主动脉瓣部位。每个受试者均获得了8个20秒的录音。此外,还收集了受试者的相关元数据,包括年龄、性别、吸烟习惯和居住地。
特点
BMD-HS 数据集的主要特点是多标签注释系统,该系统可以捕获多种疾病和独特的疾病状态。这使得数据集对于开发高级机器学习模型进行自动心脏声音分类和诊断非常有用。此外,所有录音都具有相同的持续时间,并且使用相同的听诊器进行收集,这消除了设备或领域偏差的可能性。此外,数据集的可靠性得到了加强,因为患者的条件通过超声心动图得到了证实。
使用方法
BMD-HS 数据集可用于开发机器学习模型,以自动对心脏声音进行分类和诊断。该数据集还可用作基准测试,以评估不同模型的性能。此外,该数据集可用于研究不同类型的心血管疾病与相应的人口统计和生活因素之间的关系。
背景与挑战
背景概述
心脏听诊作为一种诊断心血管疾病(CVD)的重要工具,长期以来依赖于临床医生的主观判断,这导致了一致性和准确性方面的局限性。为了解决这一问题,BUET 多病种心脏听诊数据集(BMD-HS)应运而生,这是一个全面且精心策划的心脏听诊录音集合。该数据集包含 864 段录音,涵盖五种常见的心脏听诊声音类别,代表了广泛的瓣膜性心脏病,特别关注诊断具有挑战性的病例。BMD-HS 数据集的突出特点是其创新的多元标签注释系统,该系统能够捕捉到各种疾病和独特的疾病状态。这种系统极大地增强了数据集的实用性,可用于开发先进的机器学习模型,用于自动化心脏听诊分类和诊断。通过弥合传统听诊实践和当代数据驱动诊断方法之间的差距,BMD-HS 数据集有望彻底改变 CVD 的诊断和管理,为心脏健康研究的进步提供宝贵的资源。
当前挑战
BMD-HS 数据集面临着多个挑战。首先,数据集解决的领域问题包括心血管疾病的早期检测和诊断,这在资源有限的环境中尤其具有挑战性。其次,构建过程中遇到的挑战包括确保数据的一致性、减少偏差、收集高质量的录音以及进行准确的标签注释。此外,数据集需要通过超声心动图进行验证,以确保疾病的分类准确无误。最后,数据集的可用性和易用性也是需要解决的挑战,以便研究人员和临床医生能够有效地利用这些数据来开发和评估新的诊断工具。
常用场景
经典使用场景
该数据集的经典使用场景是作为计算机辅助诊断系统(CAD)的开发工具。由于心脏听诊在很大程度上依赖于临床医生的主观判断,其一致性和准确性存在局限。BMD-HS数据集通过提供包含864个录音、跨越五个不同类别的心音记录,为发展先进的机器学习模型提供了宝贵资源,以实现自动化的心音分类和诊断。该数据集的创新多标签标注系统捕捉了广泛的疾病和独特的疾病状态,显著增强了其在开发复杂监督学习任务中的应用价值,从而推动了心血管疾病诊断和管理的发展。
实际应用
BMD-HS数据集在实际应用场景中具有广泛的前景。首先,它为发展中国家的心脏健康研究提供了宝贵资源,特别是在农村地区,医疗设施有限。其次,该数据集可以支持远程诊断和监测,有助于提高心血管疾病的早期检测率。此外,它还有助于开发基于人工智能的工具,以改善诊断实践和医疗成果,尤其是在资源有限的环境下。最后,该数据集为个性化医疗和公共卫生政策的制定提供了信息,有助于资源的合理分配和策略的制定。
衍生相关工作
BMD-HS数据集的发布为心脏疾病诊断领域带来了新的研究机遇。它推动了多种基于机器学习的诊断模型的发展,如卷积神经网络(CNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)。这些模型在BMD-HS数据集上的训练和评估,为提高心血管疾病诊断的准确性和可靠性提供了新的方法。此外,该数据集还促进了心音信号处理和特征提取技术的创新,为开发更精确的心脏病诊断工具奠定了基础。
以上内容由遇见数据集搜集并总结生成



