five

MIMIC-IV|医疗健康数据数据集|心电图数据集

收藏
github2024-09-01 更新2024-09-15 收录
医疗健康数据
心电图
下载链接:
https://github.com/veronicaramirezl/MIMIC-IV
下载链接
链接失效反馈
资源简介:
MIMIC-IV是一个免费提供的电子健康记录(EHR)数据集,涵盖了Beth Israel Deaconess Medical Center在2008年至2019年间的患者信息。该数据集包括生命体征、诊断、药物、程序和去识别化的临床笔记。MIMIC-IV还提供了一个专门的模块MIMIC-IV ECG,专注于诊断心电图(ECG),包含约80万次10秒的ECG记录,来自近16万名独特的患者。
创建时间:
2024-09-01
原始信息汇总

MIMIC-IV 数据集概述

数据集简介

MIMIC-IV 是一个免费访问的电子健康记录(EHR)数据集,涵盖了2008年至2019年期间贝斯以色列女执事医疗中心的患者信息。该数据集超越了其前身 MIMIC-III,具有更好的结构和额外的患者信息。

数据来源

  • 综合医院范围内的EHR系统
  • ICU特定的临床信息系统

数据内容

  • 生命体征
  • 诊断
  • 药物
  • 程序
  • 去识别化的临床笔记

数据特点

  • 严格的去识别化程序确保患者隐私
  • 包含约800,000个10秒的ECG记录,来自近160,000名独特患者
  • 每个ECG使用12个导联,采样频率为500 Hz

研究目标

主要目标

  • 评估 MIMIC-IV 数据库是否包含足够的连续ECG数据,以支持心脏衰竭患者心脏动态老化研究。

次要目标

  1. 分析每次住院期间ECG的时间安排。
  2. 通过ECG频率和住院次数可视化患者分布。
  3. 根据ECG数据描述研究协议的修改计划。

结论与计划

  • MIMIC 数据库包含大量在不同生命阶段记录的连续ECG。
  • 有6,400名患者的ECG显示记录之间的时间间隔超过一年。
  • 可以分析心脏衰竭患者的衰老特征,尽管无法确定慢性疾病与衰老之间的因果关系。

可能的计划修改

  • 分析心脏衰竭患者在一年的心脏特征变化,并将其与三年死亡率进行比较。
  • 尽管无法确定因果关系,但这种方法可以提供关于心脏老化在该人群中如何进展的见解。
AI搜集汇总
数据集介绍
main_image_url
构建方式
MIMIC-IV数据集的构建基于Beth Israel Deaconess Medical Center提供的十年电子健康记录(EHR)数据,涵盖2008至2019年间的患者信息。该数据集通过整合医院范围内的EHR系统和重症监护室(ICU)特定的临床信息系统,确保了数据的全面性和准确性。严格的去识别化程序在保障患者隐私的同时,保留了数据的研究价值。数据来源包括生命体征、诊断、药物、手术及去识别化的临床笔记,为研究人员提供了丰富的临床数据资源。
特点
MIMIC-IV数据集在结构和内容上超越了其前身MIMIC-III,提供了更为详尽的患者信息。其特点在于包含了约80万条10秒的12导联心电图(ECG)记录,采样频率为500Hz,覆盖了近16万名独特患者。此外,数据集中的死亡日期信息主要来源于患者在Beth Israel Deaconess Medical Center或其附属机构内的记录,确保了数据的真实性和可靠性。
使用方法
研究人员可以利用MIMIC-IV数据集进行疾病进展分析、机器学习模型的训练以及临床决策支持工具的开发。具体使用方法包括数据预处理、特征提取和模型构建。数据集的开放性和详细记录使得跨学科研究成为可能,特别是在心电图分析和心脏疾病预测领域。需要注意的是,由于数据集的限制,无法推断患者在一年后的生存状态。
背景与挑战
背景概述
MIMIC-IV数据集是一个公开可用的电子健康记录(EHR)数据集,涵盖了2008年至2019年间Beth Israel Deaconess Medical Center的病人信息。该数据集由Alistair Johnson等研究人员创建,旨在提供一个结构更优、信息更丰富的数据资源,超越其前身MIMIC-III。MIMIC-IV的数据来源主要包括医院范围内的EHR系统和ICU特定的临床信息系统,经过严格的去识别化处理,确保了患者隐私的同时保留了数据的科学完整性。该数据集包含生命体征、诊断、药物、程序和去识别化的临床笔记,为研究人员提供了丰富的资源,用于疾病进展研究、机器学习模型的训练以及临床决策支持工具的开发。
当前挑战
MIMIC-IV数据集在构建和应用过程中面临多项挑战。首先,数据的去识别化处理虽然保护了患者隐私,但也可能影响数据的完整性和可用性。其次,数据集中的死亡日期信息主要来自医院记录,对于患者在医院外或一年后的死亡情况无法提供准确信息,这限制了其在长期生存分析中的应用。此外,尽管MIMIC-IV提供了专门的ECG模块,但ECG数据的处理和分析仍需克服信号噪声、数据不一致性等技术难题。最后,数据集的广泛应用也带来了数据共享和隐私保护的伦理和法律挑战,需要制定和遵守严格的数据使用协议。
常用场景
经典使用场景
在心血管疾病研究领域,MIMIC-IV数据集的经典使用场景主要集中在利用其丰富的电子健康记录(EHR)数据进行疾病进展分析和机器学习模型的训练。通过整合来自Beth Israel Deaconess Medical Center的十年患者信息,研究者能够深入探讨心力衰竭等疾病的动态变化,并开发出更为精准的临床决策支持工具。此外,MIMIC-IV的ECG子集为研究者提供了大量高质量的心电图数据,支持对心脏年龄与实际年龄差距的预测研究,从而为个性化医疗提供了有力支持。
实际应用
在实际应用中,MIMIC-IV数据集被广泛用于开发和验证临床决策支持系统。例如,医疗机构可以利用该数据集训练机器学习模型,以预测患者的心力衰竭风险,从而提前进行干预和治疗。此外,MIMIC-IV的ECG数据为心脏病的早期诊断提供了有力支持,帮助医生更准确地评估患者的心脏健康状况。这些应用不仅提高了医疗服务的质量,还为个性化医疗的实现提供了技术基础。
衍生相关工作
MIMIC-IV数据集的发布催生了大量相关研究工作,特别是在心血管疾病和机器学习领域。例如,基于MIMIC-IV的EHR数据,研究者开发了多种预测模型,用于评估心力衰竭的风险和进展。同时,MIMIC-IV的ECG子集也被广泛应用于心电图分析和心脏年龄预测的研究中,推动了相关算法和技术的进步。这些衍生工作不仅丰富了心血管疾病的研究方法,还为临床实践提供了新的工具和视角。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录