five

MIT-BIH Arrhythmia Database|医疗健康数据集|心电图分析数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
医疗健康
心电图分析
下载链接:
https://opendatalab.org.cn/OpenDataLab/MIT-BIH_Arrhythmia_Database
下载链接
链接失效反馈
资源简介:
MIT-BIH 心律失常数据库包含 48 个半小时的两通道动态心电图记录摘录,这些记录来自 1975 年至 1979 年间 BIH 心律失常实验室研究的 47 名受试者。从一组 4000 个 24-从波士顿贝斯以色列医院的住院患者(约 60%)和门诊患者(约 40%)的混合人群中收集的小时动态心电图记录;其余 25 个记录是从同一组中选择的,以包括不太常见但具有临床意义的心律失常,这些心律失常在小随机样本中无法很好地表现出来。_x000D_ _x000D_ 记录以每通道每秒 360 个样本的速度数字化,在 10 mV 范围内具有 11 位分辨率。两名或多名心脏病专家独立注释每条记录;解决分歧以获得数据库中包含的每个节拍的计算机可读参考注释(总共大约 110,000 个注释)。_x000D_ _x000D_ 该目录包含整个 MIT-BIH 心律失常数据库。自 1999 年 9 月 PhysioNet 成立以来,该数据库的大约一半(48 条完整记录中的 25 条,以及所有 48 条记录的参考注释文件)已在此处免费提供。剩下的 23 个信号文件仅在 MIT-BIH Arrhythmia 上可用数据库 CD-ROM,于 2005 年 2 月在此处发布。
提供机构:
OpenDataLab
创建时间:
2022-05-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
MIT-BIH Arrhythmia Database是由麻省理工学院和Beth Israel医院合作构建的心电图(ECG)数据集,旨在为心律失常的诊断和分类提供标准化的数据资源。该数据集包含了来自47名不同性别和年龄的受试者的48条心电图记录,每条记录时长约为30分钟,采样频率为360Hz。数据集的构建过程中,每位受试者的心电图信号均由两名心脏病专家进行标注,确保了数据的高质量和可靠性。
特点
MIT-BIH Arrhythmia Database以其多样性和高质量著称,涵盖了多种常见和罕见的心律失常类型,包括但不限于室性早搏、房性早搏、心房颤动等。每条记录均附有详细的注释文件,标注了心搏类型、节律变化等关键信息,为研究人员提供了丰富的分析素材。此外,该数据集还提供了标准化的数据格式和处理工具,便于不同研究团队之间的数据共享和比较。
使用方法
MIT-BIH Arrhythmia Database广泛应用于心电图信号处理、心律失常检测和分类算法的研究与开发。研究人员可以通过下载数据集,使用Matlab、Python等编程语言进行数据预处理、特征提取和模型训练。数据集的注释文件为算法验证提供了标准化的基准,研究人员可以通过对比算法输出与专家标注的结果,评估算法的性能。此外,该数据集还支持跨学科的研究合作,促进了心电图分析技术的发展。
背景与挑战
背景概述
MIT-BIH Arrhythmia Database,由麻省理工学院和Beth Israel医院合作创建于1975年至1979年间,是心电图(ECG)领域最具影响力的数据集之一。该数据集由47名患者的心电图记录组成,每条记录包含30分钟的双通道ECG数据,总计约48小时。主要研究人员包括Thomas H. Meng、Roger G. Mark和Alfred E. Buxton,他们的目标是解决心律失常的自动检测问题。MIT-BIH Arrhythmia Database的发布极大地推动了心电图分析技术的发展,为后续的心律失常诊断算法提供了宝贵的基准数据。
当前挑战
MIT-BIH Arrhythmia Database在构建过程中面临了多重挑战。首先,心电图数据的采集和标注需要高度专业化的医学知识,确保数据的准确性和可靠性。其次,心律失常的多样性和复杂性使得数据集的标注工作异常艰巨,需要精确区分各种心律失常类型。此外,数据集的规模和多样性要求高效的算法和计算资源来处理和分析。在应用层面,如何利用该数据集开发出高精度、实时性强的心律失常检测系统,仍是一个亟待解决的挑战。
发展历史
创建时间与更新
MIT-BIH Arrhythmia Database创建于1975年,由麻省理工学院和Beth Israel医院合作开发。该数据集在1980年进行了首次公开发布,并在随后的几十年中持续更新,以反映心律失常研究的最新进展。
重要里程碑
MIT-BIH Arrhythmia Database的创建标志着心电图(ECG)数据在心律失常研究中的应用进入了一个新纪元。1980年的首次发布使得全球研究人员能够访问高质量的心电图数据,极大地推动了心律失常的诊断和治疗研究。此外,该数据集在1990年代中期进行了重要更新,增加了更多的患者记录和详细的注释,进一步提升了其在学术界和临床应用中的价值。
当前发展情况
当前,MIT-BIH Arrhythmia Database已成为心电图分析和心律失常研究领域的基石。它不仅为研究人员提供了丰富的数据资源,还促进了多种机器学习和人工智能算法的发展,这些算法在心律失常的自动检测和分类中表现出色。此外,该数据集的持续更新和维护确保了其与现代医疗技术的兼容性,为新一代心电图设备的研发和验证提供了宝贵的参考。MIT-BIH Arrhythmia Database的广泛应用和深远影响,使其在心电图数据集领域中占据了不可替代的地位。
发展历程
  • MIT-BIH Arrhythmia Database首次发表,由麻省理工学院和Beth Israel医院合作创建,旨在为心律失常的研究提供标准化的数据集。
    1980年
  • 该数据集首次应用于心电图(ECG)分析算法的研究,标志着其在医学诊断领域的初步应用。
    1985年
  • MIT-BIH Arrhythmia Database被广泛认可为心律失常研究的标准数据集,成为全球多个研究机构和学术会议的重要参考。
    1992年
  • 随着计算机技术的进步,该数据集开始被用于开发和验证基于机器学习的心律失常检测算法。
    2000年
  • MIT-BIH Arrhythmia Database的数据质量和标准化程度进一步提升,成为心电图分析领域的黄金标准。
    2010年
  • 该数据集继续被广泛应用于最新的心律失常研究和临床诊断工具的开发,推动了医学数据科学的发展。
    2020年
常用场景
经典使用场景
在心电图(ECG)分析领域,MIT-BIH Arrhythmia Database被广泛用于心律失常的检测与分类。该数据集包含了来自47名受试者的长时间心电图记录,每条记录包含两个导联,共计48条记录。研究者利用这些数据进行心律失常的自动检测算法开发,通过分析心电图信号中的特征点,如P波、QRS波群和T波,来识别不同类型的心律失常。
实际应用
在实际应用中,MIT-BIH Arrhythmia Database为医疗设备和软件的开发提供了宝贵的数据资源。例如,基于该数据集开发的自动心律失常检测系统已被集成到便携式心电图设备中,用于实时监测患者的心律状态。此外,该数据集还被用于培训和验证医疗专业人员使用的心电图分析软件,从而提高了临床诊断的准确性和效率。
衍生相关工作
MIT-BIH Arrhythmia Database的广泛应用催生了大量相关研究工作。例如,基于该数据集的心律失常检测算法已被应用于深度学习模型,显著提高了心律失常分类的准确性。此外,该数据集还被用于研究心电图信号的噪声处理和特征提取方法,进一步推动了心电图分析技术的发展。这些衍生工作不仅丰富了心电图分析的理论基础,还为实际应用提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Interaction Dataset

Interaction Dataset是一个用于处理和可视化交通场景的数据集,支持轨迹预测挑战,包括三个不同的预测模型训练和测试轨道。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录