COVID-19 image data collection
收藏github2020-03-28 更新2024-05-31 收录
下载链接:
https://github.com/HubBucket-Team/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS的病例。所有图像和数据将在这个GitHub仓库中公开发布。目前,我们正在从已发表的文献中收集图像,因为这些图像已经公开可用。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository. Currently, we are collecting images from published literature, as these images are already publicly available.
创建时间:
2020-03-28
原始信息汇总
数据集概述
数据集名称
- COVID-19 image data collection
数据集内容
- 包含COVID-19病例的胸部X光或CT图像。
- 数据集还包括MERS、SARS和ARDS的病例图像。
数据集结构
数据集统计
- COVID19_Dataset num_samples=99:包含99个样本,主要视图类型为PA。
- COVID19_Dataset num_samples=24:包含24个样本,视图类型包括AP和AP Supine。
数据集标签
- 标签0表示“无”,标签1表示“有”。
- 具体疾病标签包括:ARDS、Bacterial Pneumonia、COVID-19、MERS、No Finding、Pneumonia、SARS、Streptococcus、Viral Pneumonia。
数据集用途
- 用于开发AI模型,以预测和理解感染情况。
- 目标任务包括:健康与肺炎的区分、细菌性与病毒性与COVID-19肺炎的区分、患者生存预测。
数据集贡献方式
- 通过GitHub问题提交未包含的出版物图像。
- 从Radiopedia或SIRM网站收集数据。
- 提供已收集图像中的问题区域边界框/掩码。
数据格式
- 胸部X光图像:偏好格式为dcm、jpg、png。
- CT图像:偏好格式为nifti(gzip格式),也接受dcm格式。
联系方式
- 联系人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal。
- 联系链接:Joseph Paul Cohen
数据集引用信息
- 论文链接:arXiv:2003.11597
- 引用格式:
@article{cohen2020covid, title={COVID-19 image data collection}, author={Joseph Paul Cohen and Paul Morrison and Lan Dao}, journal={arXiv 2003.11597}, url={https://github.com/ieee8023/covid-chestxray-dataset}, year={2020} }
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建主要通过搜集公开出版物中的胸部X射线或CT图像,并以此为基础,形成一个包含COVID-19及其他相关病例的数据库。该数据集的构建充分利用了已有的医学图像资源,旨在为研究者提供丰富的样本,以助力人工智能辅助的医学图像分析研究。
使用方法
使用该数据集时,用户可以从GitHub上直接获取图像和元数据。数据集支持多种格式的图像,如dcm、jpg、png以及gzip格式的nifti。用户可根据自己的研究需求,选择适当的图像格式和病例类型。此外,数据集的贡献指南详细说明了如何提取图像、提交数据和提供图像中的问题区域标注,便于用户更好地参与数据集的完善和扩展。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019年新型冠状病毒(COVID-19)疫情背景下创建的,由Joseph Paul Cohen、Paul Morrison和Lan Dao等研究人员构建。该数据集旨在收集包含COVID-19病例的胸部X射线或CT图像,同时包括MERS、SARS和ARDS等病例。该数据集的建立对于开发能够辅助诊断COVID-19的AI工具具有重要意义,其研究成果已发表在arXiv上,对相关领域产生了深远影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1) 疫情期间获取病例图像的困难;2) 确保图像质量和诊断标签的准确性;3) 数据集的多样性和代表性。在研究领域问题方面,数据集面临的挑战是如何提高AI工具在COVID-19诊断中的准确性和可靠性,特别是在区分细菌性肺炎、病毒性肺炎和COVID-19肺炎方面。
常用场景
经典使用场景
在医学影像分析领域,COVID-19 image data collection数据集被广泛用于训练深度学习模型,以辅助诊断COVID-19及其他类型肺炎。该数据集包含了胸部X光和CT影像,标注了是否患有COVID-19、MERS、SARS、ARDS等疾病,是研究者和开发者进行模型训练和验证的理想资源。
解决学术问题
该数据集解决了医学影像诊断中自动识别COVID-19感染的高效性和准确性问题。通过使用该数据集,研究者能够开发出辅助诊断工具,降低误诊率,提高诊断速度,这对于控制疫情蔓延、减轻医护人员工作负担具有重要意义。
实际应用
在实际应用中,该数据集支持开发出的AI模型能够帮助放射科医生快速筛选疑似病例,为疫情防控提供技术支持。这些模型已经在一些医疗机构中得到应用,提高了诊断效率和精准度。
数据集最近研究
最新研究方向
COVID-19图像数据集的近期研究方向主要集中在利用胸部X射线和CT图像进行新型冠状病毒肺炎的自动诊断与分类。该数据集的构建不仅为研究COVID-19的影像学特征提供了宝贵的资源,而且促进了人工智能在医学影像分析领域的发展。目前,研究者们正致力于提高模型的诊断准确率,区分细菌性、病毒性与COVID-19肺炎,并探索患者生存率预测等任务。这些研究对于提升临床决策支持系统的效能,以及在全球范围内应对疫情具有重要意义。
以上内容由遇见数据集搜集并总结生成



