COVID-19 image data collection
收藏github2020-04-26 更新2024-05-31 收录
下载链接:
https://github.com/Yasin-Shah/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS病例。所有图像和数据将在此GitHub仓库中公开发布。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-04-21
原始信息汇总
数据集概述
数据集名称
- COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 同时收集MERS、SARS和ARDS的病例图像。
数据集结构
数据集样本统计
- COVID19_Dataset num_samples=201 views=[PA, AP]
- COVID19_Dataset num_samples=28 views=[AP Supine]
数据集用途
- 用于开发基于AI的方法来预测和理解感染。
- 目标任务包括:
- 健康 vs 肺炎
- 细菌性 vs 病毒性 vs COVID-19肺炎
- 患者生存预测
数据集贡献方式
- 从已发表的文献中提取图像。
- 提交数据至特定网站。
- 提供图像中问题区域的边界框/掩码。
数据格式
- 胸部X光:首选dcm, jpg, png格式。
- CT:首选nifti(gzip格式),也接受dcm格式。
联系方式
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
- 联系链接:Joseph Paul Cohen
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建,是通过搜集并公开发布胸部X射线或CT图像,涵盖COVID-19病例以及其他如MERS、SARS和ARDS等病例。数据集目前主要从已发表的文献中获取图像,这些图像是已经可用的资源。
特点
该数据集的特点在于其包含了多种病例的胸部X射线或CT图像,不仅限于COVID-19,还包括MERS、SARS和ARDS等。数据集以公开形式发布,允许研究者们进行疾病的诊断、预测和理解。此外,数据集的构建考虑了不同视角的图像,如PA、AP和AP Supine视图,以及对应的标签信息,为研究提供了丰富的样本和元数据。
使用方法
使用该数据集时,用户可以从GitHub获取图像和元数据。数据集支持多种格式的图像,如X射线的dcm、jpg或png格式,以及CT的nifti格式(gzip压缩)。用户可以根据需要,利用提供的数据加载器对数据进行加载,进而开展相关的研究工作。此外,数据集的元数据模式在SCHEMA.md文件中有详细描述,便于用户理解和应用。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019新型冠状病毒(COVID-19)疫情背景下创建的,旨在构建一个包含胸部X射线或CT图像的COVID-19病例数据库。该数据集由Joseph Paul Cohen博士后、Paul Morrison和Lan Dao共同构建,并通过GitHub平台公开。该数据集的研究背景主要针对COVID-19的及时诊断问题,利用胸部影像学技术在病毒检测中的应用,为临床诊断提供辅助。数据集的创建对于提高病毒检测效率和准确性具有重要意义,对相关领域产生了广泛影响。
当前挑战
该数据集在构建过程中面临的挑战主要包括:1)确保图像数据的质量和诊断价值,特别是在从已发表的文献中提取图像时;2)提高数据集的多样性和广泛性,涵盖不同类型和阶段的COVID-19病例;3)数据集构建过程中的隐私保护和伦理问题;4)数据集在应用于实际临床诊断时的准确性和可靠性验证。此外,数据集在解决领域问题方面的挑战包括:如何利用人工智能技术准确区分不同类型的肺炎,以及如何在保证低假阴性率的同时降低假阳性率,以避免对医疗资源的不必要占用。
常用场景
经典使用场景
在当前全球公共卫生领域,COVID-19 image data collection 数据集的构建旨在为研究者提供一份详尽的COVID-19病例影像资料,其中包括胸透X射线及CT扫描图像。该数据集的经典使用场景在于,通过影像资料辅助诊断,研究人员可借此开发人工智能模型,以辅助临床诊断,提高对COVID-19及其他类似病症如MERS、SARS、ARDS的识别准确性。
衍生相关工作
基于该数据集,已衍生出多项相关工作,包括但不限于开发自动化诊断模型、疾病进展预测工具,以及结合临床信息的综合分析模型。这些相关工作不仅加速了COVID-19的诊断和治疗研究,还为未来可能出现的类似疫情提供了宝贵的经验和数据基础。
数据集最近研究
最新研究方向
COVID-19 image data collection数据集的近期研究方向主要集中于利用胸部X射线和CT图像进行新型冠状病毒肺炎的诊断与鉴别诊断。该数据集的构建旨在服务于人工智能辅助诊断系统,通过深度学习模型对图像进行分析,以区分COVID-19与其他类型的肺炎,如细菌性肺炎、病毒性肺炎等。近期研究不仅关注于提高诊断的准确性,还致力于模型的泛化能力,以适应不同的临床场景。此外,研究者们也在探索如何通过这些图像数据预测患者的生存情况,为临床决策提供支持。这一研究方向对于优化医疗资源配置、减轻医护人员工作负担具有重要的现实意义。
以上内容由遇见数据集搜集并总结生成



