COVID-19 image data collection
收藏github2024-01-25 更新2024-05-31 收录
下载链接:
https://github.com/MuhammadArdiPutra/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。目前,我们正在从已发表的文献中收集图像,因为这些图像已经公开可用。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository. Currently, we are gathering images from published literature, as these images are already publicly available.
创建时间:
2020-03-27
原始信息汇总
数据集概述
数据集名称
- COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 同时收集MERS、SARS和ARDS的病例图像。
数据集结构
- 图像:可通过链接查看当前图像。
- 元数据:可通过链接查看元数据文件(metadata.csv)。
数据集统计
- COVID19_Dataset:
- num_samples=99,views=[PA],包含多种疾病的标签统计。
- num_samples=24,views=[AP, AP Supine],专门针对COVID-19的标签统计。
数据集用途
- 用于开发AI模型,预测和理解感染情况。
- 目标任务包括:
- 健康与肺炎的区分。
- 细菌性、病毒性与COVID-19肺炎的区分。
- 患者生存预测。
数据集贡献方式
- 从已发表的文献中提取图像。
- 提交数据至特定网站以供数据抓取。
- 提供图像中问题区域的边界框/掩码。
数据格式
- 胸部X光:首选dcm, jpg, png格式。
- CT:首选nifti(gzip格式),也接受dcm格式。
联系方式
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal。
- 联系方式:Joseph Paul Cohen个人网站。
数据集引用信息
-
作者:Joseph Paul Cohen, Paul Morrison, Lan Dao。
-
发表年份:2020。
-
引用格式:
@article{cohen2020covid, title={COVID-19 image data collection}, author={Joseph Paul Cohen and Paul Morrison and Lan Dao}, journal={arXiv}, url={https://github.com/ieee8023/covid-chestxray-dataset}, year={2020} }
搜集汇总
数据集介绍

构建方式
COVID-19图像数据集的构建主要依赖于公开的医学文献中的胸部X光片和CT图像。研究团队通过提取已发表文献中的图像,逐步扩充数据库。此外,团队还鼓励社区通过GitHub提交未被收录的文献DOI,或通过Radiopaedia和SIRM等平台提交数据,进一步丰富数据集。图像格式方面,胸部X光片优先采用dcm、jpg或png格式,而CT图像则优先使用gzip压缩的nifti格式。
特点
该数据集涵盖了COVID-19、MERS、SARS以及ARDS等多种呼吸道疾病的胸部影像数据,具有广泛的疾病覆盖性。数据集中包含PA、AP和AP Supine等多种视角的图像,且每张图像均标注了是否存在特定疾病的标签(0表示无,1表示有)。此外,数据集还提供了详细的元数据,便于研究者进行深度分析和模型训练。
使用方法
该数据集可用于开发基于人工智能的COVID-19诊断和预测模型。研究者可通过GitHub获取图像和元数据,并利用提供的数据加载器进行数据处理。数据集支持多种任务,如区分健康与肺炎、细菌性肺炎与病毒性肺炎以及COVID-19肺炎的分类,还可用于预测患者生存率。通过Chester AI Radiology Assistant平台,研究者可以本地化部署和验证模型,满足全球范围内的需求。
背景与挑战
背景概述
COVID-19图像数据收集数据集由Joseph Paul Cohen、Paul Morrison和Lan Dao于2020年创建,旨在通过胸部X光或CT图像构建COVID-19病例数据库。该数据集不仅包含COVID-19病例,还涵盖了中东呼吸综合征(MERS)、严重急性呼吸综合征(SARS)和急性呼吸窘迫综合征(ARDS)等疾病的图像。数据集的主要研究问题是通过放射影像学手段辅助COVID-19的诊断,尤其是在PCR检测资源有限的情况下,提供一种快速、可靠的筛查工具。该数据集对医学影像分析和人工智能在医疗诊断中的应用具有重要影响,推动了相关领域的研究进展。
当前挑战
COVID-19图像数据收集数据集在构建过程中面临多重挑战。首先,数据集的图像主要来源于已发表的文献,这限制了数据的多样性和数量,可能导致模型泛化能力不足。其次,COVID-19的影像特征与其他肺炎类型(如细菌性肺炎和病毒性肺炎)存在重叠,增加了分类任务的难度。此外,数据标注的准确性和一致性也是一个关键问题,尤其是在多机构合作的情况下,不同标注者的标准可能存在差异。最后,数据集的公开性和隐私保护之间的平衡需要谨慎处理,以确保患者信息的安全。这些挑战不仅影响了数据集的构建,也对基于该数据集的人工智能模型的开发和应用提出了更高的要求。
常用场景
经典使用场景
COVID-19 image data collection数据集在医学影像分析领域具有重要应用,特别是在COVID-19的胸部X光和CT影像分析中。该数据集通过收集和整理COVID-19患者的影像数据,为研究人员提供了一个宝贵的资源,用于开发和验证基于人工智能的诊断模型。这些影像数据不仅包括COVID-19病例,还涵盖了MERS、SARS和ARDS等其他呼吸道疾病的影像,为多类别疾病识别提供了基础。
衍生相关工作
基于COVID-19 image data collection数据集,许多经典研究工作得以展开。例如,研究人员开发了多种深度学习模型,用于自动识别COVID-19的影像特征,并与其他呼吸道疾病进行区分。此外,该数据集还推动了开源AI平台Chester AI Radiology Assistant的发展,该平台旨在通过本地计算实现全球范围内的COVID-19影像分析。这些工作不仅提升了AI在医学影像分析中的应用水平,也为未来的公共卫生危机应对提供了技术储备。
数据集最近研究
最新研究方向
在COVID-19疫情的背景下,胸部X光和CT影像数据的收集与分析成为医学影像领域的前沿研究方向。该数据集不仅涵盖了COVID-19病例,还包括了MERS、SARS和ARDS等其他呼吸道疾病的影像数据,为研究者提供了丰富的多类别对比分析基础。当前研究热点聚焦于利用人工智能技术进行影像自动诊断,特别是通过深度学习模型区分健康与肺炎、细菌性肺炎与病毒性肺炎以及COVID-19肺炎的影像特征。此外,研究者还致力于开发能够预测患者生存率的模型,以辅助临床决策。这些研究不仅有助于提高诊断的准确性和效率,还能在全球范围内为医疗资源分配提供科学依据,具有重要的公共卫生意义。
以上内容由遇见数据集搜集并总结生成



