five

MIMIC-III

收藏
OpenDataLab2026-03-29 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MIMIC-III
下载链接
链接失效反馈
资源简介:
重症监护医疗信息集市III (mimic-iii) 数据集是一个大的,已取消识别且可公开获得的医疗记录集合。数据集中的每个记录包括ICD-9代码,其标识诊断和执行的程序。每个代码被划分为子代码,其中通常包括特定的环境细节。该数据集由112,000个临床报告记录 (平均长度709.3个标记) 和1,159个顶级ICD-9代码组成。每个报告平均分配给7.6个代码。数据包括生命体征,药物,实验室测量,护理人员的观察和记录,体液平衡,程序代码,诊断代码,影像学报告,住院时间,生存数据等。 该数据库支持应用程序,包括学术和工业研究,质量改进计划和高等教育课程。

The Medical Information Mart for Intensive Care III (MIMIC-III) dataset is a large, de-identified and publicly available collection of medical records. Each record in the dataset contains ICD-9 codes, which identify diagnoses and performed procedures. Each code is divided into subcodes, which typically include specific contextual details. This dataset comprises 112,000 clinical report records (with an average length of 709.3 tokens) and 1,159 top-level ICD-9 codes. On average, each report is assigned 7.6 codes. The data includes vital signs, medications, laboratory measurements, observations and notes from nursing staff, fluid balance, procedure codes, diagnosis codes, imaging reports, length of stay, survival data, and more. This database supports applications including academic and industrial research, quality improvement initiatives, and higher education curricula.
提供机构:
OpenDataLab
创建时间:
2022-08-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
MIMIC-III数据集的构建基于对美国多家医院电子健康记录(EHR)的深度挖掘与整合。该数据集涵盖了2001年至2012年间超过五万名患者的详细临床数据,包括但不限于人口统计信息、诊断记录、治疗过程、实验室检测结果及药物处方等。通过严格的去标识化处理,确保患者隐私的同时,保留了丰富的临床信息,为医学研究提供了宝贵的资源。
特点
MIMIC-III数据集以其高度的多样性和真实性著称,包含了多种疾病和复杂病例的详细记录,为研究者提供了广泛的研究素材。其数据结构设计合理,便于进行多维度的数据分析和挖掘。此外,该数据集还提供了丰富的元数据和代码本,帮助用户更好地理解和使用数据。
使用方法
MIMIC-III数据集主要用于医学研究和临床决策支持系统的开发。研究者可以通过该数据集进行疾病预测、治疗效果评估、患者分层等研究。使用时,需遵循数据使用协议,确保数据的合法和道德使用。数据集的下载和使用通常需要通过官方网站申请,并经过审核批准后方可获取。
背景与挑战
背景概述
MIMIC-III(Medical Information Mart for Intensive Care III)数据集由麻省理工学院计算生理学实验室于2016年发布,是重症监护领域的重要资源。该数据集包含了来自贝斯以色列女执事医疗中心超过五万名患者的电子健康记录,涵盖了从2001年至2012年的临床数据。MIMIC-III的发布极大地推动了医疗数据分析和机器学习在重症监护中的应用,为研究人员提供了丰富的数据基础,以开发和验证预测模型、诊断工具和治疗策略。其影响力不仅限于学术界,还扩展到了临床实践,促进了个性化医疗和精准医学的发展。
当前挑战
MIMIC-III数据集在构建过程中面临了多重挑战。首先,数据的高维度与复杂性使得数据清洗和预处理成为一项艰巨任务。其次,患者隐私保护要求严格,数据脱敏和匿名化处理增加了数据处理的复杂性。此外,数据集中的缺失值和噪声数据也对模型的准确性和可靠性提出了挑战。最后,如何有效地整合和分析多源异构数据,以提取有价值的临床信息,是该数据集面临的另一大难题。这些挑战不仅影响了数据集的质量,也制约了其在实际应用中的效果。
发展历史
创建时间与更新
MIMIC-III数据集由麻省理工学院计算生理学实验室于2016年创建,旨在为医疗研究提供一个全面且公开可用的电子健康记录数据库。该数据集自创建以来,经过多次更新和扩展,以确保其内容的时效性和完整性。
重要里程碑
MIMIC-III数据集的发布标志着医疗数据科学领域的一个重要里程碑。它首次将大量去识别化的临床数据公开,为研究人员提供了前所未有的资源,以探索和开发新的医疗诊断和治疗模型。此外,MIMIC-III的发布也促进了跨学科的合作,特别是在机器学习和人工智能领域,推动了这些技术在医疗保健中的应用。
当前发展情况
当前,MIMIC-III数据集已成为全球医疗研究的重要基石,被广泛应用于各种研究项目中,包括疾病预测、患者分层和治疗效果评估等。随着技术的进步,MIMIC-III的数据也被用于开发和验证新的算法和模型,进一步提升了其在医疗决策支持系统中的应用价值。此外,MIMIC-III的成功也催生了后续版本的开发,如MIMIC-IV,继续推动医疗数据科学的发展。
发展历程
  • MIMIC-III数据集的概念首次被提出,作为麻省理工学院计算生理学实验室的一个研究项目。
    2003年
  • MIMIC-III数据集开始收集来自贝斯以色列女执事医疗中心的重症监护室患者数据。
    2008年
  • MIMIC-III数据集正式发布,包含来自2001年至2012年间的超过40,000名患者的临床数据。
    2016年
  • MIMIC-III数据集首次应用于医学研究,特别是在重症监护和临床预测模型的开发中。
    2017年
  • MIMIC-III数据集的扩展版本MIMIC-IV发布,涵盖了更广泛的时间范围和更多的临床数据。
    2019年
常用场景
经典使用场景
在医疗信息学领域,MIMIC-III数据集被广泛用于临床数据分析和预测模型的构建。该数据集包含了来自重症监护病房(ICU)的详细电子健康记录,涵盖了患者的生命体征、诊断、治疗和结局等信息。研究者利用这些数据进行疾病预测、治疗效果评估以及患者风险分层,从而为临床决策提供科学依据。
衍生相关工作
基于MIMIC-III数据集,研究者们开展了一系列经典工作。例如,通过分析患者的生命体征和治疗记录,开发了多种预测模型,如急性肾损伤(AKI)预测模型和死亡风险评估模型。此外,MIMIC-III还启发了对电子健康记录(EHR)数据的标准化和结构化研究,推动了医疗信息系统的改进。这些工作不仅提升了临床研究的深度和广度,也为后续的数据集构建和应用提供了宝贵的经验。
数据集最近研究
最新研究方向
在医疗信息学领域,MIMIC-III数据集的最新研究方向主要集中在利用机器学习和深度学习技术进行临床预测和决策支持。研究者们通过分析患者的电子健康记录,开发出能够预测疾病进展、并发症风险以及治疗效果的模型。这些模型不仅提高了医疗决策的准确性,还为个性化医疗提供了有力支持。此外,随着数据隐私保护意识的增强,如何在确保数据安全的前提下,有效利用MIMIC-III数据集进行研究,也成为了一个重要的研究热点。
相关研究论文
  • 1
    MIMIC-III, a freely accessible critical care databaseMIT · 2016年
  • 2
    Predicting In-Hospital Mortality of ICU Patients: The PhysioNet/Computing in Cardiology Challenge 2012MIT · 2012年
  • 3
    Machine Learning and Decision Support in Critical CareUniversity of Cambridge · 2019年
  • 4
    Deep learning for patient-specific kidney graft survival analysisUniversity of Oxford · 2017年
  • 5
    Temporal Phenotyping using Deep Predictive Clustering of Disease ProgressionMIT · 2018年
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作