National EMS Information System (NEMSIS) Public-Release Research Dataset
收藏github2023-12-22 更新2024-05-31 收录
下载链接:
https://github.com/csheung/clustering-masters-project
下载链接
链接失效反馈官方服务:
资源简介:
本研究旨在通过无监督机器学习和因果分析,揭示院外心脏骤停(OHCA)治疗策略中的城乡差异。数据来源于2020年国家紧急医疗服务信息系统(NEMSIS)版本3.4.0公共发布研究数据集,该数据集由MaineHealth组织管理,由Northeastern大学的Roux研究所维护。这是一个来自美国各地EMS机构提交的院前患者护理报告数据的便利样本。
This study aims to uncover urban-rural disparities in out-of-hospital cardiac arrest (OHCA) treatment strategies through unsupervised machine learning and causal analysis. The data is sourced from the 2020 National Emergency Medical Services Information System (NEMSIS) version 3.4.0 public release research dataset, managed by MaineHealth and maintained by the Roux Institute at Northeastern University. This dataset represents a convenience sample of prehospital patient care report data submitted by EMS agencies across the United States.
创建时间:
2023-12-17
原始信息汇总
数据集概述
数据集名称
- 2020 National EMS Information System (NEMSIS) Version 3.4.0 Public-Release Research Dataset
数据集描述
- 数据来源:由美国各州的12,319个EMS机构提交的预医院患者护理报告数据。
- 数据时间范围:2020年1月1日至2020年12月31日。
- 数据内容:每个记录对应一个EMS单位被派遣至报告的事件。
- 数据特点:数据集去标识化,公开可访问。
数据处理步骤
-
数据预处理
- 提取关键特征数据,如使用肾上腺素的事件、执行的医疗程序等。
- 使用Jupyter Notebook处理CSV文件,提取和转换数据。
-
分析有无处置数据(eDisposition_21)的子集
- 将数据集分为两组:有处置数据和无处置数据的事件。
- 比较两组数据的缺失值百分比和事件特征。
-
合并与EMS条件相关的选定列到主数据框
- 从多个CSV文件中读取与EMS条件相关的列,并合并到主数据框。
-
对必要列进行独热编码以准备聚类
- 将分类列转换为独热编码列。
- 应用简单插补策略处理连续和分类列。
-
准备聚类就绪的CSV文件
- 合并处理过的肾上腺素和医疗程序列到主数据框。
- 标准化连续类型列的数据。
- 过滤并保存独热编码和标准化的数据框。
-
通过运行Python脚本进行聚类
- 使用UMAP和K-Means聚类策略生成聚类结果和可视化。
数据集用途
- 本研究旨在通过无监督机器学习和因果分析揭示城市与农村在院外心脏骤停(OHCA)治疗策略上的差异。
- 通过聚类分析,识别潜在的集群,以更好地理解OHCA治疗和城乡差异,并促进对改善农村院前心脏骤停护理的干预措施的讨论。
搜集汇总
数据集介绍

构建方式
该数据集基于2020年美国国家EMS信息系统(NEMSIS)的公开研究数据集构建,涵盖了全美50个州及地区的12,319个EMS机构在2020年1月1日至12月31日期间处理的院外心脏骤停(OHCA)事件。数据来源于EMS机构提交的院前患者护理报告,经过去标识化处理,确保数据的隐私性和公开性。数据集的构建过程包括从多个CSV文件中提取关键特征,如肾上腺素使用、医疗程序应用等,并通过数据预处理步骤进行清洗和整合。
特点
该数据集的特点在于其广泛的地理覆盖范围和详细的院前护理记录。每个记录对应一次EMS派遣事件,涵盖了从药物使用到医疗程序执行的多个维度。数据集还特别关注了城乡差异,旨在揭示不同地区在OHCA治疗策略上的差异。此外,数据集通过去标识化处理,确保了数据的隐私性,同时保留了足够的细节以支持深入的分析和研究。
使用方法
该数据集的使用方法包括数据预处理、特征提取和聚类分析。用户可以通过Jupyter Notebook运行代码块,从CSV文件中提取关键特征并进行数据清洗。数据集支持多种分析方法,如无监督机器学习和因果分析,特别适用于研究城乡差异和OHCA治疗策略的优化。用户还可以通过UMAP和K-Means聚类算法对数据进行可视化分析,生成聚类标签和相关图表,以支持进一步的研究和决策。
背景与挑战
背景概述
National EMS Information System (NEMSIS) Public-Release Research Dataset 是由美国MaineHealth组织管理并由东北大学Roux研究所维护的全国性数据集,旨在为院外心脏骤停(OHCA)等紧急医疗服务(EMS)事件提供详细的数据支持。该数据集创建于2020年,涵盖了全美50个州及地区的12,319个EMS机构提交的病例报告,记录了从2020年1月1日至12月31日期间发生的EMS事件。NEMSIS数据集的核心研究问题在于通过分析EMS事件数据,揭示城乡之间在OHCA治疗策略上的差异,并推动相关干预措施的改进。该数据集在急救医学和公共卫生领域具有重要影响力,为研究人员提供了丰富的数据资源,以探索EMS服务的优化路径。
当前挑战
NEMSIS数据集在解决院外心脏骤停(OHCA)治疗策略的城乡差异问题时,面临多重挑战。首先,数据的高维性和复杂性使得特征提取和预处理过程极为繁琐,例如需要从大量医疗代码中筛选出与肾上腺素使用相关的记录。其次,数据集中存在大量缺失值和不一致性,尤其是在城乡分类和EMS事件记录完整性方面,这可能导致分析结果的偏差。此外,构建过程中还需处理多源数据的整合问题,例如将不同EMS机构的报告标准化为统一的格式。这些挑战不仅增加了数据处理的难度,也对模型的准确性和鲁棒性提出了更高要求。
常用场景
经典使用场景
NEMSIS数据集在急诊医疗服务(EMS)领域中被广泛用于分析院外心脏骤停(OHCA)的治疗策略。通过无监督机器学习和因果分析,研究者能够识别出OHCA事件中的潜在聚类,进而揭示城乡之间在急救策略上的差异。这种分析不仅有助于理解不同地区的急救模式,还为制定针对性的干预措施提供了科学依据。
解决学术问题
NEMSIS数据集为解决城乡急救资源分配不均、急救策略差异等学术问题提供了重要支持。通过对全国范围内的OHCA事件进行回顾性分析,研究者能够深入探讨城乡之间在急救响应时间、药物使用频率、急救程序等方面的差异。这些研究结果为优化急救资源配置、提升农村地区急救水平提供了数据支持,具有重要的学术意义和社会影响。
衍生相关工作
NEMSIS数据集衍生了许多相关研究,特别是在急救医学和公共卫生领域。例如,基于该数据集的研究揭示了城乡之间在急救响应时间和急救成功率上的显著差异,推动了针对农村地区的急救培训项目。此外,该数据集还被用于开发新的机器学习模型,以预测OHCA患者的生存率,并为急救人员提供实时决策支持。这些研究不仅丰富了急救医学的理论体系,还为实际急救工作提供了有力支持。
以上内容由遇见数据集搜集并总结生成



