COVID-19 image data collection
收藏github2020-04-02 更新2024-05-31 收录
下载链接:
https://github.com/biwaro/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。此数据集包括COVID-19病例以及MERS、SARS和ARDS的图像。所有图像和数据将在GitHub仓库中公开发布。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. This dataset includes images of COVID-19 cases as well as MERS, SARS, and ARDS. All images and data will be publicly released in a GitHub repository.
创建时间:
2020-04-02
原始信息汇总
数据集概述
数据集名称
- COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 同时收集MERS、SARS和ARDS的病例图像。
数据集结构
- 图像文件存储于
images目录。 - 元数据存储于
metadata.csv文件。
数据集统计
- COVID19_Dataset num_samples=136 views=[PA]
- COVID19_Dataset num_samples=28 views=[AP, AP Supine]
数据集用途
- 用于开发AI模型,以预测和理解COVID-19感染。
- 目标任务包括:
- 健康 vs 肺炎
- 细菌性 vs 病毒性 vs COVID-19肺炎
- 患者生存预测
数据集贡献方式
- 从已发表的文献中提取图像。
- 提交数据至Radiopaedia或SIRM网站。
- 提供图像中问题区域的边界框/掩码。
数据格式
- 胸部X光:首选dcm, jpg, png格式。
- CT:首选nifti格式(gzip压缩)。
联系方式
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
- 个人网站:Joseph Paul Cohen
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建,主要通过收集经发表的含有COVID-19病例的胸部X射线或CT图像,旨在构建一个包含COVID-19及其他如MERS、SARS和ARDS病例的数据库。数据集的图像和相关信息将公开于此GitHub仓库中,目前正处于从已发表文献中搜集图像的阶段。
特点
该数据集的特点在于其包含了多种病例的胸部X射线或CT图像,不仅涵盖COVID-19,还涉及MERS、SARS和ARDS等。数据集以公开、可扩展的方式进行构建,支持多种格式的图像,如dcm、jpg、png和gzip格式的nifti。此外,数据集还提供了相应的元数据模式,方便用户理解和利用。
使用方法
使用该数据集时,用户可以从GitHub仓库中获取图像和元数据。数据集支持多种视角的图像,如PA、AP和AP Supine。用户可通过已提供的data loader进行数据加载,并根据需要选择相应的病例类型进行研究和分析。此外,数据集的构建者还鼓励社区参与,包括识别新的文献来源、提交数据和提供图像中的问题区域标注。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019年底新型冠状病毒(COVID-19)疫情背景下创建的。该数据集由Joseph Paul Cohen、Paul Morrison和Lan Dao等研究人员构建,旨在收集并公开胸片或CT影像中COVID-19病例的数据。其研究背景源于COVID-19的诊断依赖于聚合酶链反应(PCR)检测,但患者肺部病变在胸片和CT影像上具有一定的特征性,这为利用影像学手段进行诊断提供了可能。数据集的构建不仅对提高诊断效率和准确性具有重要意义,而且对于理解病毒感染过程、评估治疗效果以及开展人工智能辅助诊断研究具有深远影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1) 影像数据的获取与标注,特别是在确保数据质量和隐私保护的前提下;2) 数据的多样性和代表性,需要涵盖不同病情阶段、不同人群和不同设备的影像资料;3) 数据集的动态更新和扩展,随着疫情的发展和研究的深入,需要不断纳入新的病例和影像数据。在所解决的领域问题上,该数据集面临的挑战包括:如何通过影像学手段提高对COVID-19病例的识别准确性,以及如何在保证低误诊率和漏诊率的前提下,为临床决策提供有效支持。
常用场景
经典使用场景
在医学影像分析领域,COVID-19 image data collection数据集的典型应用场景在于辅助医生进行胸部X射线或CT影像的解析,以识别COVID-19及其他相关疾病的特征。该数据集提供了一个公开的资源,可供研究者训练和验证深度学习模型,以实现自动化诊断的目的。
解决学术问题
该数据集解决了学术研究中关于如何利用医学影像快速准确识别COVID-19病例的问题。通过此数据集,研究者能够开发出辅助诊断工具,这对于减少对PCR测试的依赖,加快诊断速度,降低假阴性率,以及避免不必要的社会负担具有重要意义。
衍生相关工作
基于该数据集,已衍生出多项相关工作,包括但不限于AI辅助的肺炎类型鉴别、患者生存率预测等研究。这些工作不仅拓宽了医学影像分析的应用范围,也为全球抗击COVID-19疫情提供了有力的技术支持。
以上内容由遇见数据集搜集并总结生成



