COVID-19 image data collection
收藏github2020-10-07 更新2024-05-31 收录
下载链接:
https://github.com/lindawangg/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-03-18
原始信息汇总
数据集概述
数据集名称
COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 同时收集MERS、SARS和ARDS的病例图像。
数据集状态
- 当前正在构建数据库,主要从已发表的文献中提取图像。
- 所有图像和数据将公开发布于GitHub仓库。
数据集使用
- 用于开发AI模型,以预测和理解感染情况。
- 目标包括区分健康与肺炎、细菌性与病毒性肺炎与COVID-19肺炎,以及预测患者生存情况。
数据集贡献方式
- 从文献中提取未包含的图像。
- 提交数据至特定网站,如https://radiopedia.org/或https://www.sirm.org/category/senza-categoria/covid-19/。
- 提供已收集图像中的问题区域边界框/掩码。
数据格式
- 胸部X光图像:首选dcm, jpg, 或png格式。
- CT图像:首选nifti(gzip格式),也接受dcms格式。
联系信息
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
- 联系方式:Joseph Paul Cohen个人网站
搜集汇总
数据集介绍

构建方式
COVID-19图像数据集的构建主要依赖于从已发表的医学文献中提取胸部X光片和CT图像。这些图像经过筛选和标注,涵盖了COVID-19、MERS、SARS以及ARDS等多种呼吸道疾病。数据集的构建过程强调公开透明,所有图像和元数据均通过GitHub平台公开发布,便于全球研究人员的访问和使用。
特点
该数据集的特点在于其多样性和专业性,不仅包含了COVID-19的影像数据,还涵盖了其他相关呼吸道疾病的图像。数据集中的每张图像都附有详细的元数据,包括疾病标签和图像来源,这为研究人员提供了丰富的信息以支持深度学习模型的训练和验证。此外,数据集的图像格式多样,支持dcm、jpg、png等多种格式,适应不同的研究需求。
使用方法
数据集的使用方法相对直观,研究人员可以通过GitHub获取图像和元数据,利用提供的数据加载器进行模型训练和测试。数据集特别适用于开发基于AI的诊断工具,旨在通过胸部X光片或CT图像预测肺炎类型及患者生存率。此外,数据集还鼓励社区贡献,研究人员可以通过提交新的图像或改进现有数据的标注来丰富数据集的内容。
背景与挑战
背景概述
COVID-19图像数据收集项目始于2020年初,由蒙特利尔大学Mila研究所的博士后研究员Joseph Paul Cohen主导。该数据集旨在通过收集胸部X光和CT图像,构建一个包含COVID-19、MERS、SARS和ARDS等多种呼吸道疾病的图像数据库。其核心研究问题在于利用这些图像数据开发基于人工智能的诊断工具,以辅助医疗工作者在疫情期间快速、准确地识别感染病例。该数据集不仅为COVID-19的诊断提供了重要的视觉参考,还推动了医学影像分析与人工智能交叉领域的研究进展。
当前挑战
该数据集在构建过程中面临多重挑战。首先,COVID-19的诊断依赖于PCR检测,而影像学特征仅具有中等特异性,这导致图像标注的准确性难以保证。其次,数据集的多样性受到限制,部分疾病(如MERS和SARS)的样本量较少,可能影响模型的泛化能力。此外,图像来源主要依赖于已发表的文献,数据获取的时效性和完整性存在不确定性。最后,如何在保护患者隐私的前提下公开数据,同时确保数据的标准化和可重复性,也是构建过程中需要解决的关键问题。
常用场景
经典使用场景
COVID-19 image data collection 数据集主要用于医学影像分析领域,特别是通过胸部X光和CT图像来识别和分类COVID-19病例。该数据集为研究人员提供了一个丰富的图像库,涵盖了COVID-19、MERS、SARS和ARDS等多种呼吸道疾病的影像数据。这些数据被广泛应用于训练和验证机器学习模型,以提高疾病诊断的准确性和效率。
衍生相关工作
基于COVID-19 image data collection 数据集,许多经典的研究工作得以展开。例如,研究人员开发了多种深度学习模型,用于区分COVID-19与其他类型的肺炎。这些模型在公开的医学影像数据集上进行了广泛的验证,展示了其在疾病诊断中的潜力。此外,该数据集还促进了开源AI工具的开发,如Chester AI Radiology Assistant平台,这些工具在全球范围内得到了广泛应用,推动了医学影像分析的普及和发展。
数据集最近研究
最新研究方向
在COVID-19疫情背景下,胸部X光和CT影像数据集的研究方向主要集中在利用人工智能技术进行疾病诊断和预测。当前的研究热点包括开发基于深度学习的模型,以区分健康个体与肺炎患者,以及进一步区分细菌性肺炎、病毒性肺炎和COVID-19肺炎。此外,研究者们还在探索如何利用这些影像数据预测患者的生存率。这些研究不仅有助于提高诊断的准确性和效率,还能在全球范围内减轻医疗系统的负担,特别是在资源有限的情况下。通过公开数据集和开源工具,研究者们能够共同推动这一领域的发展,为未来的公共卫生危机提供更有效的应对策略。
以上内容由遇见数据集搜集并总结生成



