COVID-19 image data collection
收藏github2020-09-09 更新2024-05-31 收录
下载链接:
https://github.com/BlessLord/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。数据来源于公共资源及医院和医生的间接收集,所有图像和数据均在此GitHub仓库公开发布。
Construct a publicly accessible open dataset comprising chest X-ray and CT images of COVID-19 positive or suspected patients, along with images of other viral and bacterial pneumonias. The data is sourced from public resources and indirectly collected from hospitals and physicians. All images and data are publicly released in this GitHub repository.
创建时间:
2020-09-09
原始信息汇总
数据集概述
数据集名称
COVID-19 Image Data Collection
数据集目的
构建一个公开的胸部X光和CT图像数据集,包含COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS和ARDS)的图像。
数据来源
数据来源于公共资源以及通过间接方式从医院和医生处收集。
数据集内容
- 图像类型:胸部X光和CT图像
- 标签结构:采用层次化标签,具体结构可参考提供的hierarchy.jpg图像。
- 当前统计:
- PA和AP视图的样本数为481,AP Supine视图的样本数为173。
- 包含多种疾病的标签统计,如COVID-19、Bacterial、ARDS等。
数据集附加信息
- 注释:包括肺部边界框、胸部X光分割、肺炎严重程度评分等。
- 贡献方式:可通过提交数据、帮助识别未包含的出版物等方式参与贡献。
数据集使用许可
- 图像的许可信息在metadata.csv文件中指定,包括Apache 2.0、CC BY-NC-SA 4.0、CC BY 4.0等。
- metadata.csv、脚本和其他文档根据CC BY-NC-SA 4.0许可发布。
数据集目标
利用这些图像开发基于AI的方法来预测和理解感染,特别是用于健康与肺炎的区分、预后/严重性预测等任务。
数据集联系信息
- 项目负责人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
数据集引用信息
- 相关论文和源代码可在提供的链接中找到。
搜集汇总
数据集介绍

构建方式
COVID-19图像数据集的构建基于公开来源和医院、医生的间接收集,涵盖了COVID-19患者及其他病毒性和细菌性肺炎(如MERS、SARS和ARDS)的胸部X光和CT图像。该数据集经过蒙特利尔大学伦理委员会的批准(#CERSES-20-058-D),所有图像和数据均公开发布在GitHub仓库中。数据通过分层标签进行组织,确保数据的结构化和可访问性。
使用方法
该数据集可用于开发基于AI的COVID-19诊断和预后预测模型。研究者可以通过GitHub获取数据,并使用提供的元数据和注释进行模型训练和验证。数据集支持多种格式,如DCM、JPG、PNG和NIFTI,便于不同研究需求的使用。此外,数据集还提供了多个开源工具和基线模型,帮助研究者快速上手并进行模型优化。
背景与挑战
背景概述
COVID-19图像数据收集项目由蒙特利尔大学的Joseph Paul Cohen等人于2020年发起,旨在构建一个公开的胸部X光和CT图像数据集,涵盖COVID-19及其他病毒性和细菌性肺炎患者。该数据集通过公开来源和医院间接收集数据,并经蒙特利尔大学伦理委员会批准(#CERSES-20-058-D)。其核心研究问题是通过计算分析提升COVID-19的诊断和预后预测能力,为临床决策提供支持。该数据集在医学影像分析和人工智能领域具有重要影响力,推动了基于AI的肺炎分类和严重程度预测研究。
当前挑战
该数据集面临的挑战主要包括两方面:首先,在领域问题方面,COVID-19的影像特征与其他肺炎类型存在重叠,导致分类模型难以准确区分病毒性、细菌性和COVID-19肺炎。其次,在数据构建过程中,图像来源多样且标注标准不一致,增加了数据清洗和标注的复杂性。此外,数据集中部分类别样本量较少,可能导致模型训练时的类别不平衡问题,影响预测性能。这些挑战需要通过更精细的数据标注、数据增强技术以及跨机构合作来解决。
常用场景
经典使用场景
COVID-19 image data collection数据集广泛应用于医学影像分析领域,特别是在COVID-19疫情的背景下,该数据集为研究人员提供了丰富的胸部X光和CT图像资源。这些图像涵盖了COVID-19、其他病毒性和细菌性肺炎等多种肺部疾病,使得研究者能够通过深度学习模型进行疾病分类、病变区域检测以及病情严重程度评估。该数据集的多层次标签结构为模型的训练和验证提供了坚实的基础,尤其是在区分健康与肺炎、病毒性与细菌性肺炎等任务中表现出色。
解决学术问题
该数据集解决了医学影像分析中的多个关键学术问题,尤其是在COVID-19诊断和预后预测方面。通过提供大量标注的胸部X光和CT图像,研究者能够开发出基于人工智能的诊断工具,帮助医生快速识别COVID-19感染患者。此外,数据集还支持病情严重程度的预测,如是否需要插管或补充氧气,从而为临床决策提供科学依据。这些研究不仅提升了诊断的准确性,还为未来的公共卫生应急响应提供了宝贵的数据支持。
实际应用
在实际应用中,COVID-19 image data collection数据集为医疗机构提供了强大的辅助诊断工具。通过训练深度学习模型,医生可以在等待放射科医生分析结果的同时,获得初步的病情评估,从而加快诊断速度。此外,该数据集还被用于开发定量评分系统,帮助医生更准确地评估患者的病情进展。这些工具在疫情期间极大地缓解了医疗资源的压力,并为患者提供了更及时的救治。
数据集最近研究
最新研究方向
在COVID-19疫情的背景下,COVID-19图像数据集的构建与应用成为医学影像分析领域的前沿研究方向。该数据集通过收集公开的胸部X光和CT图像,涵盖了COVID-19及其他病毒性和细菌性肺炎的病例,为开发基于人工智能的诊断和预后工具提供了重要数据支持。近年来,研究者们利用该数据集探索了多种深度学习模型,旨在实现从健康与肺炎的分类到COVID-19严重程度的预测。特别是在肺炎严重性评分、肺部区域分割及预后预测等任务中,该数据集的应用显著提升了模型的性能。此外,结合临床数据的多模态分析也成为研究热点,为个性化医疗和精准诊断提供了新的可能性。这一数据集的开放共享不仅推动了全球范围内的科研合作,也为应对未来公共卫生危机奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



