MIMIC-IV
收藏github2024-09-01 更新2024-09-15 收录
下载链接:
https://github.com/veronicaramirezl/MIMIC-IV
下载链接
链接失效反馈官方服务:
资源简介:
MIMIC-IV是一个免费提供的电子健康记录(EHR)数据集,涵盖了Beth Israel Deaconess Medical Center在2008年至2019年间的患者信息。该数据集包括生命体征、诊断、药物、程序和去识别化的临床笔记。MIMIC-IV还提供了一个专门的模块MIMIC-IV ECG,专注于诊断心电图(ECG),包含约80万次10秒的ECG记录,来自近16万名独特的患者。
MIMIC-IV is a freely accessible electronic health record (EHR) dataset covering patient information from Beth Israel Deaconess Medical Center between 2008 and 2019. This dataset includes vital signs, diagnoses, medications, procedures, and de-identified clinical notes. MIMIC-IV also provides a dedicated module, MIMIC-IV ECG, which focuses on electrocardiogram (ECG) diagnostics, containing approximately 800,000 10-second ECG records from nearly 160,000 unique patients.
创建时间:
2024-09-01
原始信息汇总
MIMIC-IV 数据集概述
数据集简介
MIMIC-IV 是一个免费访问的电子健康记录(EHR)数据集,涵盖了2008年至2019年期间贝斯以色列女执事医疗中心的患者信息。该数据集超越了其前身 MIMIC-III,具有更好的结构和额外的患者信息。
数据来源
- 综合医院范围内的EHR系统
- ICU特定的临床信息系统
数据内容
- 生命体征
- 诊断
- 药物
- 程序
- 去识别化的临床笔记
数据特点
- 严格的去识别化程序确保患者隐私
- 包含约800,000个10秒的ECG记录,来自近160,000名独特患者
- 每个ECG使用12个导联,采样频率为500 Hz
研究目标
主要目标
- 评估 MIMIC-IV 数据库是否包含足够的连续ECG数据,以支持心脏衰竭患者心脏动态老化研究。
次要目标
- 分析每次住院期间ECG的时间安排。
- 通过ECG频率和住院次数可视化患者分布。
- 根据ECG数据描述研究协议的修改计划。
结论与计划
- MIMIC 数据库包含大量在不同生命阶段记录的连续ECG。
- 有6,400名患者的ECG显示记录之间的时间间隔超过一年。
- 可以分析心脏衰竭患者的衰老特征,尽管无法确定慢性疾病与衰老之间的因果关系。
可能的计划修改
- 分析心脏衰竭患者在一年的心脏特征变化,并将其与三年死亡率进行比较。
- 尽管无法确定因果关系,但这种方法可以提供关于心脏老化在该人群中如何进展的见解。
搜集汇总
数据集介绍

构建方式
MIMIC-IV数据集的构建基于Beth Israel Deaconess Medical Center提供的十年电子健康记录(EHR)数据,涵盖2008至2019年间的患者信息。该数据集通过整合医院范围内的EHR系统和重症监护室(ICU)特定的临床信息系统,确保了数据的全面性和准确性。严格的去识别化程序在保障患者隐私的同时,保留了数据的研究价值。数据来源包括生命体征、诊断、药物、手术及去识别化的临床笔记,为研究人员提供了丰富的临床数据资源。
特点
MIMIC-IV数据集在结构和内容上超越了其前身MIMIC-III,提供了更为详尽的患者信息。其特点在于包含了约80万条10秒的12导联心电图(ECG)记录,采样频率为500Hz,覆盖了近16万名独特患者。此外,数据集中的死亡日期信息主要来源于患者在Beth Israel Deaconess Medical Center或其附属机构内的记录,确保了数据的真实性和可靠性。
使用方法
研究人员可以利用MIMIC-IV数据集进行疾病进展分析、机器学习模型的训练以及临床决策支持工具的开发。具体使用方法包括数据预处理、特征提取和模型构建。数据集的开放性和详细记录使得跨学科研究成为可能,特别是在心电图分析和心脏疾病预测领域。需要注意的是,由于数据集的限制,无法推断患者在一年后的生存状态。
背景与挑战
背景概述
MIMIC-IV数据集是一个公开可用的电子健康记录(EHR)数据集,涵盖了2008年至2019年间Beth Israel Deaconess Medical Center的病人信息。该数据集由Alistair Johnson等研究人员创建,旨在提供一个结构更优、信息更丰富的数据资源,超越其前身MIMIC-III。MIMIC-IV的数据来源主要包括医院范围内的EHR系统和ICU特定的临床信息系统,经过严格的去识别化处理,确保了患者隐私的同时保留了数据的科学完整性。该数据集包含生命体征、诊断、药物、程序和去识别化的临床笔记,为研究人员提供了丰富的资源,用于疾病进展研究、机器学习模型的训练以及临床决策支持工具的开发。
当前挑战
MIMIC-IV数据集在构建和应用过程中面临多项挑战。首先,数据的去识别化处理虽然保护了患者隐私,但也可能影响数据的完整性和可用性。其次,数据集中的死亡日期信息主要来自医院记录,对于患者在医院外或一年后的死亡情况无法提供准确信息,这限制了其在长期生存分析中的应用。此外,尽管MIMIC-IV提供了专门的ECG模块,但ECG数据的处理和分析仍需克服信号噪声、数据不一致性等技术难题。最后,数据集的广泛应用也带来了数据共享和隐私保护的伦理和法律挑战,需要制定和遵守严格的数据使用协议。
常用场景
经典使用场景
在心血管疾病研究领域,MIMIC-IV数据集的经典使用场景主要集中在利用其丰富的电子健康记录(EHR)数据进行疾病进展分析和机器学习模型的训练。通过整合来自Beth Israel Deaconess Medical Center的十年患者信息,研究者能够深入探讨心力衰竭等疾病的动态变化,并开发出更为精准的临床决策支持工具。此外,MIMIC-IV的ECG子集为研究者提供了大量高质量的心电图数据,支持对心脏年龄与实际年龄差距的预测研究,从而为个性化医疗提供了有力支持。
实际应用
在实际应用中,MIMIC-IV数据集被广泛用于开发和验证临床决策支持系统。例如,医疗机构可以利用该数据集训练机器学习模型,以预测患者的心力衰竭风险,从而提前进行干预和治疗。此外,MIMIC-IV的ECG数据为心脏病的早期诊断提供了有力支持,帮助医生更准确地评估患者的心脏健康状况。这些应用不仅提高了医疗服务的质量,还为个性化医疗的实现提供了技术基础。
衍生相关工作
MIMIC-IV数据集的发布催生了大量相关研究工作,特别是在心血管疾病和机器学习领域。例如,基于MIMIC-IV的EHR数据,研究者开发了多种预测模型,用于评估心力衰竭的风险和进展。同时,MIMIC-IV的ECG子集也被广泛应用于心电图分析和心脏年龄预测的研究中,推动了相关算法和技术的进步。这些衍生工作不仅丰富了心血管疾病的研究方法,还为临床实践提供了新的工具和视角。
以上内容由遇见数据集搜集并总结生成



