COVID-19 image data collection
收藏github2020-05-02 更新2024-05-31 收录
下载链接:
https://github.com/mathewspjacob/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的数据库,同时也在寻找MERS、SARS和ARDS病例。所有图像和数据将公开发布在此GitHub仓库中。
We are constructing a database comprising chest X-ray or CT images of COVID-19 cases, while also seeking cases of MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-03-31
原始信息汇总
数据集概述
数据集名称
- COVID-19 image data collection
数据集内容
- 图像类型: 胸部X光或CT图像
- 目标疾病: COVID-19, MERS, SARS, ARDS
- 图像来源: 来自已发表的文献
- 图像及数据公开: 通过GitHub仓库公开
数据集统计
- COVID19_Dataset num_samples=136 views=[PA]
- 标签分布: 包括ARDS, Bacterial Pneumonia, COVID-19等多种疾病的阳性(1)和阴性(0)样本数量统计。
- COVID19_Dataset num_samples=28 views=[AP, AP Supine]
- 标签分布: 同样包括多种疾病的阳性(1)和阴性(0)样本数量统计。
数据集使用
- 目的: 用于开发基于AI的方法来预测和理解感染
- 任务:
- 健康 vs 肺炎
- 细菌性 vs 病毒性 vs COVID-19肺炎
- 患者生存预测
数据集贡献
- 图像提取: 从文献中提取图像,特别是未包含的文献
- 数据提交: 提交数据至Radiopaedia或SIRM,以便从这些平台抓取数据
- 图像标注: 提供已收集图像中问题区域的边界框/掩码
数据集格式
- 胸部X光: 首选格式为dcm, jpg, png
- CT: 首选格式为nifti(gzip格式),也接受dcm格式
联系方式
- 联系人: Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
- 联系链接: Joseph Paul Cohens website
数据集引用
-
论文: COVID-19 image data collection, arXiv:2003.11597, 2020
-
GitHub仓库: COVID-ChestXray-Dataset
-
引用格式:
@article{cohen2020covid, title={COVID-19 image data collection}, author={Joseph Paul Cohen and Paul Morrison and Lan Dao}, journal={arXiv 2003.11597}, url={https://github.com/ieee8023/covid-chestxray-dataset}, year={2020} }
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建主要通过收集经发表的COVID-19病例的胸部X射线或CT图像,旨在构建一个包含COVID-19以及其他如MERS、SARS和ARDS病例的数据库。目前,该数据库的图像来源于已发表的文献,这些图像是公开可得的。
使用方法
使用该数据集时,用户可以从GitHub获取当前的图像和元数据。数据集支持多种格式的图像,如X射线的dcm、jpg或png格式,以及CT的nifti(gzip格式)或dcm。用户可根据需要提交数据、提供问题区域的边界框/掩码,或利用数据集提供的元数据模式进行更深入的数据处理和分析。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019年新型冠状病毒(COVID-19)疫情背景下创建的,由Joseph Paul Cohen、Paul Morrison和Lan Dao等研究人员共同构建。该数据集旨在收集并公开胸部X射线或CT图像,以供医学研究之用,涵盖了COVID-19病例以及其他如MERS、SARS和ARDS等疾病的病例。这一数据集的构建,对于提高COVID-19的诊断效率和精确度具有重要意义,为相关研究提供了宝贵的数据资源,对医学影像分析和人工智能辅助诊断领域产生了显著影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括:一是确保收集到的图像数据的多样性和代表性,以适应不同患者群体的诊断需求;二是图像标注的准确性和一致性,这对于后续的模型训练和验证至关重要;三是数据集的动态更新和维护,随着新病例的出现和研究进展,需要不断扩充和更新数据集内容;四是数据集的开放性和可用性,如何确保数据的安全性和隐私保护,同时便于研究者和开发者使用。
常用场景
经典使用场景
在医学影像分析领域,COVID-19 image data collection 数据集的经典使用场景主要集中于辅助诊断COVID-19及其他相关肺炎病例。该数据集提供了胸部X射线和CT图像,可用于训练和验证深度学习模型,以识别和区分各类肺炎病例,从而辅助医生进行更快速、准确的诊断。
解决学术问题
该数据集解决了传统PCR检测在速度和便捷性上的局限,提供了可视化的影像学资料,有助于学术研究中对COVID-19的早期发现、确诊和疾病进展的跟踪。它降低了误诊和漏诊的风险,对于提高医疗效率和降低系统负担具有重要意义。
实际应用
在实际应用中,该数据集可被用于开发和部署人工智能辅助诊断系统,这些系统可在医疗资源有限的情况下,帮助基层医生对疑似病例进行快速筛选,为疫情防控提供技术支持,同时减轻医疗工作者的压力。
数据集最近研究
最新研究方向
COVID-19图像数据集的最新研究方向主要集中于利用胸部X射线和CT图像来诊断和区分COVID-19与其他类型的肺炎,如细菌性肺炎、病毒性肺炎等。这一研究方向的目的是发展人工智能辅助诊断工具,以减轻临床诊断的压力,提高诊断效率和准确性。当前研究不仅关注于肺炎的识别,还包括了对患者生存率的预测。近期的研究成果已经在Chester AI Radiology Assistant平台上得到应用,并且通过开源的方式,为全球的医疗需求提供计算支持。该数据集的构建和使用,对于提升COVID-19早期检测能力、优化医疗资源配置具有重要的现实意义和深远的影响。
以上内容由遇见数据集搜集并总结生成



