COVID-19 image data collection
收藏github2020-05-19 更新2024-05-31 收录
下载链接:
https://github.com/mohammad2682/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。数据来源于公共资源和医院及医生的间接收集,所有图像和数据将在此GitHub仓库公开发布。
Construct a publicly accessible open dataset comprising chest X-ray and CT images of COVID-19 positive or suspected patients, as well as images of other viral and bacterial pneumonias. The data is sourced from public resources and indirectly collected from hospitals and physicians. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-05-17
原始信息汇总
数据集概述
数据集名称
COVID-19 image data collection
数据集目的
构建一个公开的胸部X光和CT图像数据集,包含COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS、ARDS)的图像。
数据来源
数据来源于公共资源以及医院和医生的间接收集。
数据内容
- 胸部X光和CT图像
- 元数据文件(metadata.csv)
- 图像标注(Lung Bounding Boxes)
数据集统计
-
COVID19_Dataset num_samples=253
- 视图类型:[PA, AP]
- 标签分布:包括COVID-19、细菌性肺炎、病毒性肺炎等多种疾病的阳性(1)和阴性(0)样本数量。
-
COVID19_Dataset num_samples=45
- 视图类型:[AP Supine]
- 标签分布:主要关注COVID-19的阳性(1)和阴性(0)样本数量。
数据集使用
用于开发基于AI的方法来预测和理解感染,特别是用于健康与肺炎的区分以及预后/严重程度的预测。
数据集贡献
- 直接提交数据(即将开放)
- 从已发表的文献中提取图像
- 提供图像中问题区域的边界框/掩码
数据格式
- 胸部X光:dcm, jpg, png
- CT扫描:nifti(gzip格式)或dcm
伦理批准
该项目已获得蒙特利尔大学伦理委员会的批准(CERSES-20-058-D)。
联系方式
主要研究者:Joseph Paul Cohen, 蒙特利尔大学博士后研究员
引用信息
Joseph Paul Cohen and Paul Morrison and Lan Dao COVID-19 image data collection, arXiv:2003.11597, 2020 https://github.com/ieee8023/covid-chestxray-dataset
@article{cohen2020covid, title={COVID-19 image data collection}, author={Joseph Paul Cohen and Paul Morrison and Lan Dao}, journal={arXiv 2003.11597}, url={https://github.com/ieee8023/covid-chestxray-dataset}, year={2020} }
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建,旨在创建一个公开的开放数据集,包含经诊断为COVID-19病毒感染或疑似病例,以及其他病毒性和细菌性肺炎患者的胸部X光和CT图像。数据集通过从公共来源及间接地从医院和医生处收集获得,所有图像和数据均在此GitHub仓库中公开释放。
使用方法
使用该数据集时,用户可以从GitHub仓库中直接获取图像和元数据。数据加载器可在torchxrayvision的datasets.py文件中找到。用户需要遵循元数据模式(SCHEMA.md)来理解数据结构。此外,数据集支持多种格式,如dcm、jpg、png和nifti(gzip格式),便于不同用户的需求。
背景与挑战
背景概述
COVID-19 image data collection数据集是在COVID-19大流行背景下,由蒙特利尔大学Mila研究团队创建的。该数据集旨在构建一个公开的开放数据集,包含经胸部X光和CT扫描的COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS和ARDS)的图像。该数据集的创建得到了蒙特利尔大学伦理委员会的批准。该数据集的研究背景是,尽管已有大量典型的胸部X光公开数据集,但缺乏专为计算分析设计的COVID-19胸部X光或CT扫描图像集。此数据集的构建,对于改善预后预测、分流患者护理管理以及发展基于AI的诊断/预后工具具有重要意义。
当前挑战
该数据集在构建过程中面临的挑战主要包括:1) 疫情期间数据的收集难度较大,需要从公共来源以及医院和医生的间接收集;2) 数据标注和分类的准确性要求高,需要精确区分COVID-19与其他类型肺炎的影像学特征;3) 在数据集的应用研究中,如何避免未经验证的临床研究声明模型的诊断性能是一个重要挑战。此外,数据集在解决领域问题如图像分类、预后/严重程度预测等方面,还需克服模型泛化能力、数据隐私保护以及跨机构数据共享等难题。
常用场景
经典使用场景
在当前COVID-19疫情背景下,COVID-19 image data collection数据集被广泛用于训练和验证计算机辅助诊断模型。该数据集包含大量经标注的胸部X射线和CT扫描图像,可用于辅助医生识别患者是否感染了COVID-19或其他类型的肺炎,如MERS、SARS和ARDS等。通过这一数据集,研究者能够开发出具有较高准确度的诊断模型,从而为临床决策提供支持。
解决学术问题
该数据集解决了如何在影像学领域利用人工智能进行快速、准确诊断的学术问题。通过提供大量标注数据,它促进了相关算法的开发和验证,有助于提升模型的性能,降低误诊率,为疫情防控提供了有力的数据支撑。此外,该数据集还助力于理解COVID-19在不同患者群体中的影像学表现,为后续研究提供了宝贵的信息。
实际应用
在实际应用中,COVID-19 image data collection数据集已被用于构建辅助诊断工具,帮助医生在等待专业放射科医生评估期间,快速获得对病患状况的数字化辅助意见。这种工具的应用,有望减少误诊率,提高医疗效率,为患者提供更及时的治疗。
数据集最近研究
最新研究方向
COVID-19图像数据集的最新研究方向主要集中在利用深度学习技术对胸部X射线和CT图像进行分析,以实现对COVID-19及其他病毒性和细菌性肺炎的自动检测与诊断。该数据集的构建旨在促进AI辅助放射学诊断工具的开发,特别是在预后预测、病人分类管理以及疾病严重性评估等方面。近期研究不仅关注于提高模型的诊断准确性,还致力于为临床医生提供定量的评分工具,以便在等待放射科医师分析结果期间,能有一个数字化的辅助意见来确认对病人状况的评估。此外,该数据集的公开性为机器学习模型的并行开发及快速本地化验证提供了便利,有望推动该领域的科研进展。
以上内容由遇见数据集搜集并总结生成



