five

Awesome Healthcare Datasets

收藏
github2024-04-07 更新2024-05-31 收录
下载链接:
https://github.com/nickls/awesome-healthcare-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
一个精选的公共领域医疗保健数据集列表,包含多种类型的医疗保健数据,如提供者数据、电子健康记录系统、药物信息等。

A curated list of public domain healthcare datasets, encompassing a variety of healthcare data types such as provider data, electronic health record systems, medication information, and more.
创建时间:
2016-02-04
原始信息汇总

数据集概述

提供者数据

  • 国家提供者标识符 (NPI)

    • 数据内容:提供者详细信息(姓名、资格、性别等)、组织详细信息(名称、类型等)、执业地址、专业/医疗分类、州执照。
    • 数据来源:CMS 官网
    • 文件格式:ZIP (578M)
  • 排除的个人和实体列表

    • 数据内容:提供者详细信息(NPI等)、排除详情。
    • 数据来源:HHS OIG 官网
    • 文件格式:ZIP (11M)
  • 医师比较

    • 数据内容:提供者详细信息(NPI、姓名、资格、性别等)、资格(医学院、入学年份、专业)、团体执业(法定名称、PAC ID、地址等)。
    • 数据来源:Medicare 数据门户
    • 文件格式:CSV (196M)
  • Medicare 利用率

    • 数据内容:提供者详细信息(NPI、姓名、资格、性别等)、程序代码(HCPCS)、程序描述、程序数量、报销详情。
    • 数据来源:CMS 官网
    • 文件格式:ZIP (1.9G)
  • 开放支付

    • 数据内容:提供者详细信息(姓名、ID等)、制造商详细信息(名称、ID)、产品详细信息(药物或设备名称)、支付详情(类型、美元价值等)。
    • 数据来源:CMS 官网
  • 医师转诊

    • 数据内容:初始NPI、二级NPI、共享计数和唯一受益人计数。
    • 数据来源:CMS 问答门户

电子健康记录系统

  • EHR 认证计划

    • 数据内容:认证ID、供应商和产品名称、使用详情(州、提供者类型、专业、NPI等)。
    • 数据来源:健康IT数据门户
    • 文件格式:CSV (234M)
  • 认证健康IT产品列表

    • 数据内容:产品详情、认证标准、临床质量测量。
    • 数据来源:ONC CHPL 官网
    • 文件格式:XLS (7M)

药物

  • FAERS 数据文件

    • 数据内容:FDA 不良事件报告系统数据。
    • 数据来源:FDA 官网
    • 文件格式:XML (73M)
  • 药物代码目录

    • 数据内容:药物名称、剂量、代码和标签详情。
    • 数据来源:FDA 官网
    • 文件格式:ZIP (19M)
  • 药片识别

    • 数据内容:药片名称、图像、形状和印记。
    • 数据来源:NLM Pillbox 官网
    • 文件格式:TAB (40M)

Medicare 优势计划

  • MA 计划目录
    • 数据内容:所有Medicare Advantage公司和合同列表。
    • 数据来源:CMS 官网
    • 文件格式:ZIP (190K)
搜集汇总
数据集介绍
main_image_url
构建方式
Awesome Healthcare Datasets 数据集通过精心策划,汇集了多个公开领域的医疗数据资源。其构建方式主要依赖于从美国政府机构、医疗监管机构以及相关组织中获取公开数据,并进行分类整理。数据来源包括国家提供者标识符(NPI)、医疗保险和医疗补助服务中心(CMS)、食品药品监督管理局(FDA)等。每个数据集都经过详细的标注和分类,涵盖了从医疗服务提供者信息到药品、电子健康记录系统等多个领域,确保数据的全面性和多样性。
特点
该数据集的特点在于其广泛性和多样性。它不仅包含了医疗服务提供者的详细信息,如姓名、资质、性别等,还涵盖了药品、电子健康记录系统、医疗保险计划等多个方面的数据。此外,数据集中的每个子集都提供了丰富的元数据,如数据来源、更新时间、文件格式等,便于用户快速定位和使用所需信息。数据集的公开性和易获取性也为其在医疗研究、政策分析等领域的应用提供了便利。
使用方法
使用Awesome Healthcare Datasets数据集时,用户可以根据需求选择不同的子集进行下载和分析。每个子集通常以CSV、ZIP、XML等格式提供,用户可以通过编程工具或数据分析软件直接处理这些数据。例如,研究者可以利用NPI数据集分析医疗服务提供者的分布情况,或通过FAERS数据集研究药品不良反应。此外,数据集的README文件提供了详细的说明和下载链接,用户可以据此快速上手并进行数据处理和分析。
背景与挑战
背景概述
Awesome Healthcare Datasets 是一个精心策划的公开医疗数据集列表,旨在为医疗领域的研究者和开发者提供丰富的资源。该数据集由多个机构和研究人员共同维护,涵盖了从医疗服务提供者数据、电子健康记录系统、药品信息到医疗保险计划等多个方面。其核心研究问题在于如何通过整合和分析这些数据,提升医疗服务的透明度、效率和质量。该数据集的创建不仅为医疗数据分析提供了基础,还对推动医疗信息化和智能化发展具有重要意义。
当前挑战
尽管Awesome Healthcare Datasets提供了丰富的医疗数据资源,但其构建和应用过程中仍面临诸多挑战。首先,数据来源广泛且格式多样,如何有效整合和标准化这些数据是一个重要难题。其次,医疗数据的隐私和安全问题尤为突出,如何在保证数据安全的前提下进行有效利用是一个亟待解决的问题。此外,医疗数据的复杂性和高维度性也给数据分析和模型构建带来了技术上的挑战。最后,如何确保数据的准确性和时效性,以便为决策提供可靠支持,也是该数据集面临的一个重要挑战。
常用场景
经典使用场景
在医疗数据分析领域,Awesome Healthcare Datasets 数据集的经典使用场景主要体现在对医疗服务提供者的详细信息进行深入分析。例如,研究者可以利用该数据集中的National Provider Identifier(NPI)数据,对美国医疗提供者的专业资质、性别、执业地址及专业领域进行系统性研究,从而评估医疗服务的分布和质量。此外,Medicare Utilization数据可用于分析医疗服务提供者的服务利用率和支付情况,为政策制定者提供数据支持。
衍生相关工作
基于Awesome Healthcare Datasets 数据集,许多经典工作得以展开。例如,有研究利用NPI数据分析了医疗服务的空间分布,揭示了城乡医疗资源的不均衡现象。此外,Medicare Utilization数据的分析揭示了不同医疗服务提供者的服务模式和收入差异,为医疗经济学研究提供了重要数据支持。这些研究不仅丰富了医疗数据分析的理论框架,也为实际政策制定提供了科学依据。
数据集最近研究
最新研究方向
在医疗数据领域,Awesome Healthcare Datasets的最新研究方向主要集中在利用这些公开数据集进行医疗服务的优化与监管。研究者们通过分析电子健康记录系统(EHR)、药物不良反应报告(FAERS)以及医疗保险支付数据,探索如何提高医疗服务的效率和质量。此外,数据集中的药物代码目录和药品识别信息为药物安全性和有效性的研究提供了重要支持。这些研究不仅有助于提升医疗系统的透明度和公平性,还为政策制定者提供了科学依据,以优化医疗资源分配和监管机制。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作