COVID-19 image data collection
收藏github2020-05-15 更新2024-05-31 收录
下载链接:
https://github.com/zahrael97/covid-chestxray-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的公开数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS病例。所有图像和数据将在此GitHub仓库中公开发布。
We are constructing an open-access database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-04-24
原始信息汇总
数据集概述
数据集名称
COVID-19 image data collection
数据集内容
- 图像类型: 胸部X光或CT图像
- 病例类型: COVID-19、MERS、SARS、ARDS
- 图像来源: 来自已发表的文献
- 数据发布: 所有图像和数据将公开发布于GitHub仓库
数据集结构
- 图像: 可通过链接查看当前图像
- 元数据: 可通过链接查看元数据文件
metadata.csv - 数据加载器: 数据加载器位于此处
数据集样本统计
- 样本数量: 201张图像(视图类型:PA, AP)和28张图像(视图类型:AP Supine)
- 标签: 0=无,1=有
- 具体分类统计: 包括ARDS、细菌性肺炎、COVID-19等多种分类的样本分布
数据集贡献
- 图像提取: 从文献中提取图像,可通过GitHub issue帮助识别未包含的文献
- 数据提交: 可提交数据至多个网站,如Radiopaedia、SIRM等
- 图像标注: 提供边界框/掩码以识别图像中的问题区域
数据集目标
- 应用: 开发基于AI的方法来预测和理解感染情况
- 平台: 使用开源的Chester AI Radiology Assistant平台进行模型发布
- 任务: 包括健康与肺炎的区分、患者生存/预后预测等
联系方式
- 联系人: Joseph Paul Cohen
- 职位: 博士后研究员,Mila,蒙特利尔大学
- 个人网站: Joseph Paul Cohen
数据集引用
@article{cohen2020covid, title={COVID-19 image data collection}, author={Joseph Paul Cohen and Paul Morrison and Lan Dao}, journal={arXiv 2003.11597}, url={https://github.com/ieee8023/covid-chestxray-dataset}, year={2020} }
搜集汇总
数据集介绍

构建方式
COVID-19 image data collection数据集的构建,主要通过收集并公开胸部X射线或CT图像的COVID-19病例,同时包含MERS、SARS和ARDS等病例。该数据集的图像来源于已发表的文献,以确保图像的可用性。
特点
本数据集的特点在于,它是一个公开的数据库,专注于COVID-19及相关疾病的胸部影像学表现。数据集不仅包含COVID-19病例,还涵盖其他如MERS、SARS等疾病,为研究提供了多元化的样本。此外,数据集提供了不同视角(PA、AP和AP Supine)的图像,以及详细的标签信息,有助于精确的疾病诊断和模型训练。
使用方法
使用该数据集时,用户可以从GitHub仓库中获取图像和元数据。数据集支持多种格式,如dcm、jpg、png和nifti(gzip格式)。用户可以通过数据加载器轻松地加载数据,并利用提供的数据进行模型训练和疾病诊断研究。
背景与挑战
背景概述
COVID-19 image data collection数据集是在2019年新型冠状病毒(COVID-19)疫情背景下创建的,旨在构建一个包含胸部X光或CT图像的COVID-19病例数据库。该数据集由一系列研究人员和机构共同构建,其中包括来自中国的团队,他们在早期便开始收集和分析病例。该数据集的核心研究问题是利用医学影像学技术,特别是胸部X光和CT图像,来辅助诊断COVID-19,提高诊断的准确性和效率。它在相关领域的影响力体现在为医学影像诊断、机器学习模型训练和临床研究提供了宝贵的数据资源。
当前挑战
构建COVID-19 image data collection数据集过程中遇到的挑战主要包括:1) 确保图像质量和诊断信息的准确性,因为诊断的准确性依赖于高质量的图像;2) 数据收集过程中的隐私和伦理问题,尤其是涉及患者敏感信息的处理;3) 数据标注的准确性和一致性,这直接关系到后续模型的训练效果;4) 数据集的多样性和代表性,以确保模型在不同人群和场景中的泛化能力。此外,数据集在解决领域问题方面面临的挑战包括如何利用这些图像数据开发出具有临床实用价值的诊断模型,并确保这些模型在实际应用中的可靠性和有效性。
常用场景
经典使用场景
在医学影像分析领域,COVID-19 image data collection 数据集的典型应用场景在于辅助医生进行胸部X射线或CT影像的识别,以诊断患者是否感染COVID-19或其他相关疾病。该数据集通过提供大量的病例影像和标签,为研究者开发自动化诊断工具提供了丰富的训练资源。
解决学术问题
该数据集解决了学术研究中关于如何准确识别COVID-19病例的问题,通过机器学习模型在大量标注数据上的训练,可以有效提高诊断的准确性和效率,对于降低假阴性和假阳性率,减轻医疗系统负担具有重要意义。此外,该数据集也促进了医学影像分析技术在疾病早期发现和治疗中的应用。
衍生相关工作
基于COVID-19 image data collection 数据集,研究者们衍生出了一系列相关工作,包括但不限于开发更为精细化的诊断模型,探索不同影像学特征与疾病严重程度的关系,以及利用这些数据进行预后分析等。这些研究进一步扩展了数据集的应用范围,推动了医学影像分析领域的学术进步和技术发展。
以上内容由遇见数据集搜集并总结生成



