NIH ChestX-ray8 dataset
收藏github2020-12-03 更新2024-05-31 收录
下载链接:
https://github.com/hasibzunair/cxr-dataset-list
下载链接
链接失效反馈官方服务:
资源简介:
NIH临床中心提供的公开可用的大型胸部X光数据集之一,供科学界使用。
One of the publicly available large-scale chest X-ray datasets provided by the NIH Clinical Center, intended for use by the scientific community.
创建时间:
2020-10-17
原始信息汇总
数据集概述
病理预测
-
NIH ChestX-ray8 数据集
- 来源:NIH Clinical Center
- 链接:NIH ChestX-ray8
- 论文:arXiv:1705.02315
-
RSNA Pneumonia Detection Challenge
- 来源:RSNA
- 链接:RSNA Pneumonia Detection Challenge 2018
- Kaggle竞赛:RSNA Pneumonia Detection Challenge
-
NIH Google
-
PadChest 数据集
- 来源:Hospital San Juan de Alicante – University of Alicante
- 链接:PadChest
-
CheXpert
-
MIMIC-CXR
-
OpenI
- 链接:OpenI
-
COVID-19 image data collection
-
National Library of Medicine Tuberculosis Datasets
-
Pediatric bacterial and viral pneumonia chest X-rays
伪影检测
-
object-CXR
- 链接:object-CXR
-
ML-CDS 2020 Challenge
分割
- v7labs COVID lung segmentations
显著性
- Eye Gaze Data for Chest X-rays
搜集汇总
数据集介绍

构建方式
NIH ChestX-ray8数据集由美国国立卫生研究院(NIH)临床中心提供,构建过程涉及从大量公开可用的胸部X光片中筛选和标注。该数据集包含了超过10万张胸部X光图像,每张图像均附有详细的病理标签,涵盖了14种常见的胸部疾病。通过与放射科专家的合作,确保了标签的准确性和可靠性,从而为医学影像分析提供了高质量的训练和测试数据。
使用方法
NIH ChestX-ray8数据集适用于多种医学影像分析任务,包括但不限于疾病分类、病理预测和图像识别。用户可以通过下载数据集并使用深度学习框架(如TensorFlow或PyTorch)进行模型训练。数据集提供了详细的标签文件,便于用户进行监督学习。此外,该数据集也可用于评估现有模型的性能,或作为基准数据集进行算法比较和验证。
背景与挑战
背景概述
NIH ChestX-ray8数据集是由美国国立卫生研究院(NIH)临床中心于2017年发布的一个大规模公开胸部X光片数据集。该数据集包含了超过10万张标注的胸部X光图像,涵盖了14种常见的病理特征,如肺炎、肺结核等。这一数据集的发布极大地推动了医学影像分析领域的发展,特别是在深度学习模型的训练和评估方面。NIH ChestX-ray8数据集的主要研究人员包括来自NIH临床中心和多家合作机构的专家,其核心研究问题是如何利用深度学习技术提高胸部X光片的病理预测准确性。该数据集的发布不仅为学术界提供了宝贵的研究资源,也为临床诊断提供了新的工具和方法,具有广泛的影响力。
当前挑战
NIH ChestX-ray8数据集在构建和应用过程中面临了多项挑战。首先,数据集的标注过程复杂且耗时,需要专业放射科医生的参与,以确保标注的准确性和可靠性。其次,胸部X光图像中病理特征的多样性和复杂性增加了模型训练的难度,尤其是在处理小病灶和模糊边界时。此外,数据集中可能存在的噪声和伪影也对模型的性能提出了更高的要求。在应用层面,如何将深度学习模型与现有的临床工作流程有效结合,以及如何确保模型在不同医疗环境中的泛化能力,也是当前面临的重要挑战。
常用场景
经典使用场景
NIH ChestX-ray8数据集在医学影像领域中被广泛应用于胸部X光片的病理预测任务。该数据集包含了超过10万张标注的胸部X光片,涵盖了14种常见的病理特征,如肺炎、肺结节和心脏肥大等。通过深度学习模型,研究者能够利用这些数据进行病理分类和检测,从而辅助放射科医生进行诊断。这一经典应用场景不仅推动了医学影像分析技术的发展,也为自动化诊断系统提供了宝贵的训练资源。
解决学术问题
NIH ChestX-ray8数据集解决了医学影像分析中的一大难题,即如何在大量非结构化数据中准确识别和分类多种病理特征。传统的放射学诊断依赖于医生的经验和主观判断,而该数据集通过提供大规模、标注精细的影像数据,使得机器学习模型能够从中学习并模拟人类专家的诊断过程。这不仅提高了诊断的准确性和效率,还为研究者提供了一个标准化的基准,用于评估和比较不同算法在病理预测任务中的表现。
实际应用
在实际应用中,NIH ChestX-ray8数据集已被广泛用于开发和验证自动化胸部X光片分析系统。这些系统在医院和诊所中被用于辅助放射科医生进行快速诊断,特别是在资源有限的地区,能够显著提高诊断效率和准确性。此外,该数据集还被用于培训新一代的医学影像分析算法,这些算法在新冠肺炎等全球性健康危机中发挥了重要作用,帮助快速识别和分类相关病例,从而支持公共卫生决策。
数据集最近研究
最新研究方向
在医学影像分析领域,NIH ChestX-ray8数据集因其大规模和多样性,成为研究胸部X光图像病理预测的核心资源。近年来,该数据集在前沿研究中主要聚焦于深度学习模型的应用,以提高疾病检测的准确性和效率。特别是,结合放射科医生 adjudicated 参考标准和人口调整评估的深度学习模型,显著提升了胸部X光图像的解读能力。此外,随着COVID-19疫情的爆发,NIH ChestX-ray8数据集也被广泛用于开发和验证针对新冠肺炎的自动检测算法,进一步推动了其在公共卫生事件中的应用和影响。
以上内容由遇见数据集搜集并总结生成



