MDS-ED
收藏arXiv2024-07-25 更新2024-07-29 收录
下载链接:
https://github.com/AI4HealthUOL/MDS-ED
下载链接
链接失效反馈官方服务:
资源简介:
MDS-ED数据集由卡尔·冯·奥西茨基大学奥尔登堡分校AI4Health部门创建,旨在支持急诊部门的多元决策。该数据集包含71,098名患者的121,195次独特访问,总计129,095个样本,涵盖患者到达急诊部门后1.5小时内的多种数据模式,包括人口统计学、生物统计学、生命体征、实验室值和心电图波形。数据集的创建过程涉及将MIMIC-IV-ECG数据集的心电图波形与MIMIC-IV和MIMIC-IV-ED数据集的临床特征和结果链接。MDS-ED数据集主要应用于急性医学和急诊医学领域,旨在通过多元数据支持提高诊断准确性和患者恶化预测的效率。
The MDS-ED dataset was developed by the AI4Health division of Carl von Ossietzky University of Oldenburg, aiming to support multivariate decision-making in emergency departments. It contains 121,195 unique visits from 71,098 patients, totaling 129,095 samples, covering various data modalities within 1.5 hours after patients arrive at emergency departments, including demographics, biostatistics, vital signs, laboratory values, and electrocardiogram (ECG) waveforms. The dataset creation process involved linking the ECG waveforms from the MIMIC-IV-ECG dataset with clinical features and outcomes from the MIMIC-IV and MIMIC-IV-ED datasets. Primarily applied in the fields of acute medicine and emergency medicine, the MDS-ED dataset is designed to improve diagnostic accuracy and the efficiency of patient deterioration prediction by leveraging multivariate data.
提供机构:
卡尔·冯·奥西茨基大学奥尔登堡分校AI4Health部门
创建时间:
2024-07-25
原始信息汇总
MDS-ED: Multimodal Decision Support in the Emergency Department
数据集概述
MDS-ED 是一个在急诊部门用于诊断和恶化预测的生物医学多模态基准数据集。该数据集在两个全面的设置中进行评估:
- 患者出院诊断:包含 1,428 名患者的出院诊断数据。
- 患者恶化事件:包含 15 名患者的恶化事件数据。
数据集包括患者在到达后 90 分钟内收集的各种数据,如:
- 人口统计
- 生物特征
- 生命体征趋势
- 实验室值趋势
- ECG 波形
数据集特点
- 全面规模:MDS-ED 在开源领域中患者数量排名第一,访问次数排名第二,尽管仅关注急诊到达后的前 1.5 小时。
- 特征多样性:MDS-ED 在特征模态方面领先,包括人口统计、生物特征、生命体征趋势、实验室值趋势和 ECG 波形,使其比大多数数据集更广泛。
- 广泛的目标标签:MDS-ED 提供 1,443 个目标标签,远多于其他数据集。
- 可访问性:MDS-ED 是开源的,促进进一步的研究和合作。
基准测试结果
- 多模态模型的优越性能:结果显示,集成多种数据类型的多模态模型在诊断和恶化任务中表现更优。
- 原始 ECG 波形的性能提升:在诊断任务中,使用 ECG 原始波形而非 ECG 特征可以显著提高性能。
- ECG 波形在诊断设置中的优势:基于 ECG 波形的模型在诊断设置中优于仅基于表格数据的模型,但在恶化设置中并非如此。
参考文献
bibtex @misc{alcaraz2024mdsedmultimodaldecisionsupport, title={MDS-ED: Multimodal Decision Support in the Emergency Department -- a Benchmark Dataset for Diagnoses and Deterioration Prediction in Emergency Medicine}, author={Juan Miguel Lopez Alcaraz and Nils Strodthoff}, year={2024}, eprint={2407.17856}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2407.17856}, }
搜集汇总
数据集介绍

构建方式
MDS-ED数据集基于MIMIC-IV数据集构建,旨在为急诊室的多模态决策支持提供一个基准数据集。该数据集整合了患者到达急诊室后最初1.5小时内收集的各种数据模态,包括人口统计学、生物测量学、生命体征、实验室值和心电图波形。这些数据用于分析1443个临床标签,涵盖两个上下文:预测ICD-10编码的诊断和预测患者恶化。
特点
MDS-ED数据集具有以下几个显著特点:首先,数据集规模庞大,包含71,098名患者、121,195次独特的就诊和129,095个样本,是开源领域内规模最大的数据集之一。其次,数据集具有多样化的输入特征,包括人口统计学、生物测量学、生命体征趋势、实验室值趋势和心电图波形,这使得数据集在特征模态方面处于开源领域的领先地位。第三,数据集具有全面的预测目标,包括1,443个目标标签,覆盖了广泛的临床任务,如心脏和非心脏诊断、患者恶化、ICU入院、短期和长期死亡率等。最后,数据集是开源的,这有助于促进进一步的研究和合作。
使用方法
使用MDS-ED数据集时,研究者可以将其作为基准数据集来评估和验证他们开发的多模态决策支持模型。数据集提供了详细的文档和预处理步骤,方便用户进行数据加载和模型训练。此外,数据集还提供了分层的训练、验证和测试数据集,有助于评估模型的泛化能力。研究者可以根据自己的需求选择合适的模型架构和训练策略,并利用数据集提供的预测任务和目标来评估模型的性能。
背景与挑战
背景概述
在紧急医疗领域,医疗决策支持算法的性能评估常常受到数据集获取受限、预测任务范围狭窄以及输入模态受限等问题的困扰。这些问题影响了算法的临床相关性和在高风险领域如紧急护理中的性能,使得算法的复制、验证和改进变得复杂。MDS-ED数据集基于MIMIC-IV数据集,旨在为评估紧急部门的多元决策支持提供基准。该数据集使用患者在到达紧急部门后的前1.5小时内收集的各种数据模态,包括人口统计、生物特征、生命体征、实验室值和心电图波形。通过分析1443个临床标签,涵盖两个上下文:使用ICD-10代码预测诊断结果和预测患者病情恶化。MDS-ED数据集的创建标志着对紧急医疗领域医疗决策支持算法性能评估的一次重要突破,它为该领域的研究人员提供了一个强大的工具,有助于推动紧急医疗领域的人工智能研究向前发展。
当前挑战
MDS-ED数据集的构建过程中面临的主要挑战包括:1) 数据集构建过程中的数据质量保证,确保收集的数据准确、完整且具有代表性;2) 数据集的隐私保护,确保患者隐私不被泄露;3) 数据集的可用性和可访问性,确保数据集可以方便地被研究人员使用。此外,MDS-ED数据集的研究背景和挑战还包括:1) 紧急医疗领域的医疗决策支持算法的性能评估问题;2) 紧急医疗领域的数据集获取受限、预测任务范围狭窄以及输入模态受限等问题。这些问题都需要在未来的研究中得到解决。
常用场景
经典使用场景
MDS-ED数据集在紧急医学领域的主要应用场景是预测患者的出院诊断和病情恶化。通过整合多种数据模式,包括人口统计信息、生物识别特征、生命体征、实验室值和心电图波形,该数据集能够在患者到达急诊室后的前1.5小时内收集的数据基础上进行预测。这使得MDS-ED成为评估紧急医学中多模态决策支持系统性能的理想基准。
衍生相关工作
MDS-ED数据集衍生了多项相关的研究工作。例如,一些研究利用MDS-ED数据集评估了基于心电图波形和表格数据的预测模型的性能。此外,MDS-ED数据集还被用于开发新的机器学习模型,以提高紧急医学中决策支持算法的性能。这些相关研究有助于推动紧急医学领域决策支持算法的发展和应用。
数据集最近研究
最新研究方向
在急诊医学领域,MDS-ED数据集的最新研究方向聚焦于多模态决策支持系统,旨在通过整合患者的人口统计学、生物计量学、生命体征、实验室值和心电图波形等数据,对急诊室患者的诊断和病情恶化进行预测。该数据集的创新之处在于其广泛的临床任务覆盖范围,以及对急诊室患者到达后的前1.5小时内收集的全面特征集的应用。研究结果表明,该数据集在诊断和病情恶化预测方面均取得了显著的性能提升,特别是当整合原始心电图波形数据时,模型的性能显著提高。这些发现强调了MDS-ED数据集在急性医疗和急诊医学决策制定中的革命性潜力,为临床决策提供了及时和准确的预测,减少了诊断错误,并提高了患者护理质量。未来的研究方向包括将自由文本数据纳入模型,并探索在更专业的数据集上开发更精细的诊断或病情恶化预测模型。
相关研究论文
- 1MDS-ED: Multimodal Decision Support in the Emergency Department -- a Benchmark Dataset for Diagnoses and Deterioration Prediction in Emergency Medicine卡尔·冯·奥西茨基大学奥尔登堡分校AI4Health部门 · 2024年
以上内容由遇见数据集搜集并总结生成



