five

COVID-19 Posteroanterior Chest X-Ray fused (CPCXR) dataset

收藏
github2023-03-24 更新2024-05-31 收录
下载链接:
https://github.com/nspunn1993/COVID-19-PA-CXR-fused-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由COVID-19胸部X光图像、北美放射学会(RSNA)和美国家医学图书馆(USNLM)收集的蒙哥马利县-NLM(MC)三个公开数据集融合而成。数据集包含标记为COVID-19、结核病、其他肺炎(SARS、MERS等)和正常的样本。

This dataset is a fusion of three publicly available datasets: COVID-19 chest X-ray images, the Radiological Society of North America (RSNA), and the Montgomery County-NLM (MC) collected by the US National Library of Medicine (USNLM). The dataset includes samples labeled as COVID-19, tuberculosis, other pneumonias (such as SARS, MERS, etc.), and normal cases.
创建时间:
2020-07-21
原始信息汇总

COVID-19 Posteroanterior Chest X-Ray fused (CPCXR) dataset

数据集来源

该数据集是通过融合三个公开数据集生成的:

  • COVID-19 cxr image
  • Radiological Society of North America (RSNA)
  • U.S. national library of medicine (USNLM) collected Montgomery country - NLM(MC)

数据集内容

数据集包含以下类别的样本:

  • Normal
  • COVID-19
  • Other pneumonia
  • Tuberculosis

数据集用途

该数据集可用于训练和评估深度学习及机器学习模型,解决二元和多类别分类问题。

数据集详细信息

Class Label Samples
Normal 0 533
COVID-19 1 108
Other pneumonia 2 515
Tuberculosis 3 58

数据集获取

完整数据集可在此处获取:链接

引用信息

@article{Punn_2020, title={Automated diagnosis of COVID-19 with limited posteroanterior chest X-ray images using fine-tuned deep neural networks}, ISSN={1573-7497}, DOI={10.1007/s10489-020-01900-3}, journal={Applied Intelligence}, publisher={Springer Science and Business Media LLC}, author={Punn, Narinder Singh and Agarwal, Sonali}, year={2020} }

搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19 Posteroanterior Chest X-Ray fused (CPCXR) 数据集是通过融合三个公开可用的数据集构建而成,包括COVID-19胸部X光图像数据集、北美放射学会(RSNA)数据集以及美国国家医学图书馆(USNLM)收集的蒙哥马利县数据集。该数据集涵盖了COVID-19、肺结核、其他肺炎(如SARS、MERS等)以及正常样本,旨在为深度学习与机器学习模型的训练与评估提供多样化的数据支持。
特点
CPCXR数据集的特点在于其多类别标签的丰富性,涵盖了COVID-19、肺结核、其他肺炎及正常样本,样本数量分别为108、58、515和533。这种多样化的数据分布使得该数据集能够有效支持二分类和多分类任务的模型训练与评估,为医学影像分析领域的研究提供了重要的数据基础。
使用方法
CPCXR数据集可用于训练和评估深度学习与机器学习模型,特别适用于二分类和多分类问题的研究。用户可通过提供的Google Drive链接下载完整数据集,并利用其标注信息进行模型训练与测试。该数据集的应用场景包括但不限于COVID-19的自动化诊断、肺炎类型的分类以及医学影像分析算法的性能评估。
背景与挑战
背景概述
COVID-19 Posteroanterior Chest X-Ray fused (CPCXR) 数据集是在2020年由Narinder Singh Punn和Sonali Agarwal等研究人员创建的,旨在通过融合三个公开可用的胸部X光数据集(COVID-19 cxr image、RSNA肺炎检测挑战数据集以及美国国家医学图书馆的Montgomery数据集),为COVID-19及其他肺部疾病的自动化诊断提供支持。该数据集包含COVID-19、肺结核、其他肺炎(如SARS、MERS等)以及正常样本的多类别标签,为深度学习模型的训练与评估提供了丰富的资源。其核心研究问题在于通过有限的胸部X光图像实现COVID-19的自动化诊断,推动了医学影像分析领域的发展,并为相关研究提供了重要的数据基础。
当前挑战
CPCXR数据集在解决COVID-19及其他肺部疾病的自动化诊断问题时,面临的主要挑战包括数据不平衡问题,例如COVID-19样本数量较少,可能导致模型在训练过程中偏向多数类。此外,数据集融合过程中,不同来源的图像质量、分辨率和标注标准存在差异,增加了数据预处理和标准化的难度。在构建过程中,研究人员还需克服数据隐私和伦理问题,确保公开数据集的合法性和安全性。这些挑战不仅影响了模型的泛化能力,也对数据集的广泛应用提出了更高的要求。
常用场景
经典使用场景
COVID-19 Posteroanterior Chest X-Ray fused (CPCXR) 数据集在医学影像分析领域具有重要应用,尤其在COVID-19的自动化诊断中。该数据集通过融合多个公开的胸部X光图像数据集,提供了丰富的样本,涵盖了COVID-19、肺结核、其他肺炎(如SARS、MERS等)以及正常病例。研究人员可以利用该数据集训练和评估深度学习模型,进行二分类或多分类任务,从而实现对胸部X光图像的自动化疾病诊断。
实际应用
在实际应用中,CPCXR数据集已被广泛应用于医疗机构的自动化诊断系统中。通过训练基于该数据集的深度学习模型,医生可以快速、准确地识别患者的胸部X光图像,从而在早期阶段发现COVID-19等疾病。这不仅提高了诊断效率,还减轻了医疗资源的压力,特别是在疫情高峰期。此外,该数据集还被用于开发远程医疗系统,使得偏远地区的患者也能获得及时的诊断和治疗。
衍生相关工作
CPCXR数据集催生了一系列相关研究工作,特别是在深度学习模型的优化和应用方面。例如,研究人员利用该数据集开发了多种基于卷积神经网络(CNN)的模型,用于COVID-19的自动化诊断。此外,该数据集还被用于研究多任务学习、迁移学习等技术,以进一步提高模型的泛化能力和诊断精度。这些研究不仅推动了医学影像分析领域的发展,还为未来的公共卫生事件应对提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作