COVID-19 image data collection
收藏github2020-03-19 更新2024-05-31 收录
下载链接:
https://github.com/tripoworld/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的数据库。我们正在寻找COVID-19病例,以及MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。
We are constructing a database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19, as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-03-19
原始信息汇总
数据集概述
数据集名称
COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 同时收集MERS、SARS和ARDS的病例图像。
数据集使用
- 图像和数据将公开发布于GitHub仓库。
- 目前数据库正在构建中,主要使用已发表的图像。
数据集统计
- 标签:0=无,1=有
- 当前统计数据包括COVID-19、MERS、SARS、ARDS等多种情况的数量分布。
数据集贡献
- 鼓励从已发表的文献中提取图像,并通过GitHub问题提交未包含的文献。
- 可以提交数据至radiopedia.org或sirm.org,并提供图像中问题区域的边界框/掩码。
数据格式
- 胸部X光:偏好dcm, jpg, png格式
- CT:偏好nifti(gzip格式),也接受dcm格式
数据集目标
- 使用图像开发基于AI的方法来预测和理解感染。
- 目标包括区分健康与肺炎、细菌性与病毒性肺炎、COVID-19肺炎及患者生存预测。
联系方式
Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal
初始结果
- 展示了一个使用UMAP可视化的COVID-19 X光图像结果。
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建,是通过收集并公开胸部X射线或CT图像的方式进行的。该数据集的构建主要利用已发表的医学影像资源,以确保图像的可用性和公开性。
特点
该数据集的特点在于其包含了COVID-19以及其他如MERS、SARS和ARDS等病例的影像资料,为研究提供了丰富的样本。此外,数据集采用标签0和1来表示病例的有无,便于模型的训练与验证。
使用方法
使用该数据集时,用户可以从GitHub仓库中获取图像和元数据。用户可以根据提供的元数据加载器,方便地加载和利用数据集。同时,数据集支持通过贡献出版物、提供数据或图像中的问题区域边界框等方式进行扩展和优化。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019新型冠状病毒(COVID-19)疫情背景下,由研究人员构建的医学图像数据库。该数据集旨在收集包含胸部X射线或CT图像的COVID-19病例,以及中东呼吸综合征(MERS)、严重急性呼吸综合征(SARS)和急性呼吸窘迫综合征(ARDS)的病例。该数据库的构建由多伦多大学Mila实验室的博士后研究员Joseph Paul Cohen领衔,旨在为研究人员提供开放资源,以促进基于人工智能的医学图像分析和诊断工具的开发。数据集的创建对提高COVID-19的诊断效率和精确性具有重要意义,对相关领域产生了深远影响。
当前挑战
该数据集在构建和应用过程中面临的挑战主要包括:一是如何确保图像数据的多样性和代表性,以便能够涵盖各种病例和影像表现;二是如何在保护患者隐私的同时,公开分享敏感的医学图像数据;三是如何有效地整合和标注来自不同来源和格式的图像数据,以适应不同的研究需求。此外,数据集在解决领域问题方面的挑战在于,如何利用这些图像数据开发出准确率高、泛化能力强的AI模型,以辅助医生进行疾病诊断,尤其是在区分不同类型的肺炎方面。
常用场景
经典使用场景
COVID-19 image data collection数据集的构建旨在收集并公开肺部X光或CT图像,以供医学图像分析和人工智能辅助诊断之用。该数据集的经典使用场景在于,研究人员和开发者可通过此数据集训练深度学习模型,以识别COVID-19及其他如MERS、SARS和ARDS等疾病的影像学特征,从而辅助临床诊断和病情评估。
实际应用
在实际应用中,COVID-19 image data collection数据集可用于开发人工智能辅助诊断系统,以支持医生在临床上对疑似病例进行快速筛选和精准诊断。此外,该数据集还能助力疫情防控中心进行疫情监测和趋势分析,为政策制定和医疗资源配置提供科学依据。
衍生相关工作
基于COVID-19 image data collection数据集,已衍生出多项相关工作,包括但不限于开发用于肺炎类型区分、生存率预测的人工智能模型,以及结合其他类型的医疗数据进行的综合分析研究。这些工作进一步扩展了数据集的应用范围,并促进了医学影像分析领域的发展。
以上内容由遇见数据集搜集并总结生成



