COVID-19 image data collection
收藏github2022-11-16 更新2024-05-31 收录
下载链接:
https://github.com/SafwenNaimi/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的数据库。我们正在寻找COVID-19病例,以及MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。目前,我们正在从已发表的文献中收集图像,这些图像已经公开可用。
We are constructing a database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19, as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository. Currently, we are collecting images from published literature that are already publicly available.
创建时间:
2020-03-17
原始信息汇总
COVID-19图像数据集概述
数据集内容
- 数据集名称:COVID-19图像数据收集
- 图像类型:胸部X光或CT图像
- 包含病例:COVID-19、MERS、SARS、ARDS
数据集状态
- 当前状态:正在构建数据库,主要从已发表的文献中提取图像
- 数据公开:所有图像和数据将在GitHub仓库中公开
数据集统计
- 标签定义:0=无,1=有
- 当前统计数据:
- ARDS: 0.0=75, 1.0=4
- Bacterial Pneumonia: 0.0=73, 1.0=6
- COVID-19: 0.0=23, 1.0=56
- MERS: 0.0=79
- No Finding: 0.0=78, 1.0=1
- Pneumonia: 0.0=2, 1.0=77
- SARS: 0.0=68, 1.0=11
- Streptococcus: 0.0=73, 1.0=6
- Viral Pneumonia: 0.0=12, 1.0=67
数据集目标
- 目标:使用这些图像开发基于AI的方法来预测和理解感染情况
- 使用平台:将使用开源的Chester AI Radiology Assistant平台发布模型
联系方式
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
- 个人网站:Joseph Paul Cohen
搜集汇总
数据集介绍

构建方式
COVID-19图像数据集的构建主要依赖于从已发表的文献中提取胸部X光或CT图像。这些图像经过筛选和整理,涵盖了COVID-19、MERS、SARS以及ARDS等多种呼吸道疾病的病例。数据集通过GitHub平台公开,并持续更新,旨在为研究者提供高质量的医学影像数据。此外,数据集还鼓励社区贡献,通过提交新的图像或标注来丰富数据内容。
特点
该数据集的特点在于其多样性和开放性。它不仅包含了COVID-19的影像数据,还涵盖了其他呼吸道疾病的图像,如MERS、SARS和ARDS。数据集的标签系统采用二元分类(0=无,1=有),便于机器学习模型的训练和验证。此外,数据集提供了详细的元数据,包括图像来源和疾病类型,为研究者提供了丰富的信息支持。
使用方法
数据集的使用方法相对简单,用户可以通过GitHub页面直接访问图像和元数据文件。数据集还提供了一个数据加载器,便于在机器学习框架中快速加载和处理数据。研究者可以利用这些数据开发AI模型,用于COVID-19的诊断和预测。此外,数据集鼓励用户通过提交新的图像或标注来参与数据集的扩展和优化。
背景与挑战
背景概述
COVID-19 image data collection数据集由Joseph Paul Cohen及其团队于2020年创建,旨在通过收集胸部X光片和CT图像,构建一个公开的COVID-19病例数据库。该数据集不仅包含COVID-19病例,还涵盖了MERS、SARS和ARDS等其他呼吸道疾病的图像。这些图像主要来源于已发表的文献,旨在为开发基于人工智能的诊断工具提供数据支持。该数据集的创建受到了COVID-19疫情期间对快速、准确诊断工具的迫切需求推动,相关研究已在《Radiology》等权威期刊上发表,并在全球范围内引起了广泛关注。
当前挑战
该数据集面临的主要挑战包括数据多样性和标注质量。首先,COVID-19的影像特征与其他呼吸道疾病(如MERS、SARS)存在重叠,增加了分类模型的训练难度。其次,数据集中不同类别的样本分布不均衡,例如COVID-19阳性样本较多,而MERS和ARDS样本较少,可能导致模型在少数类别上的表现不佳。此外,数据集的构建依赖于从文献中提取图像,这一过程可能受到图像质量和标注一致性的限制。最后,尽管数据集旨在支持AI模型的开发,但其规模和多样性仍需进一步扩展,以应对临床诊断中的复杂场景。
常用场景
经典使用场景
COVID-19 image data collection数据集在医学影像分析领域具有重要应用,尤其是在COVID-19的诊断中。该数据集通过收集胸部X光和CT影像,为研究人员提供了丰富的图像数据,用于训练和验证基于人工智能的诊断模型。这些影像数据不仅包括COVID-19病例,还涵盖了MERS、SARS和ARDS等其他呼吸道疾病,使得该数据集在多种疾病的影像分析中具有广泛的应用价值。
实际应用
在实际应用中,COVID-19 image data collection数据集已被广泛应用于医院和医疗机构的AI诊断工具开发中。通过使用该数据集训练的模型,医生可以更快速、更准确地识别COVID-19感染病例,从而优化治疗方案并提高患者的生存率。此外,该数据集还为全球范围内的COVID-19研究提供了宝贵的数据资源,促进了国际合作与知识共享。
衍生相关工作
基于COVID-19 image data collection数据集,许多经典的研究工作得以展开。例如,研究人员开发了多种深度学习模型,用于COVID-19的自动检测和分类。这些模型不仅在学术界引起了广泛关注,还被应用于实际的医疗诊断中。此外,该数据集还推动了开源AI工具的开发,如Chester AI Radiology Assistant平台,为全球的医学影像分析研究提供了强大的技术支持。
以上内容由遇见数据集搜集并总结生成



