five

COVID-19 image data collection

收藏
github2024-01-30 更新2024-05-31 收录
下载链接:
https://github.com/ayushk01/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。数据来源于公共资源和医院及医生的间接收集,所有图像和数据将在GitHub仓库中公开发布。

Construct a publicly accessible open dataset comprising chest X-ray and CT images of COVID-19 positive or suspected patients, along with images of other viral and bacterial pneumonias. The data is sourced from public resources and indirectly collected from hospitals and physicians. All images and data will be publicly released in a GitHub repository.
创建时间:
2020-09-02
原始信息汇总

数据集概述

数据集名称

COVID-19 Image Data Collection

项目目的

构建一个公开的开放数据集,包含COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS、ARDS)的胸部X光和CT图像。

数据来源

数据来源于公共资源以及通过间接方式从医院和医生处收集。

数据内容

  • 胸部X光和CT图像
  • 元数据(位于metadata.csv
  • 图像标签层次结构(示例图位于docs/hierarchy.jpg

数据统计

  • COVID19_Dataset num_samples=481 views=[PA, AP]
  • COVID19_Dataset num_samples=173 views=[AP Supine]

标签说明

标签采用0=No或1=Yes的格式,具体标签包括:

  • ARDS
  • Bacterial
  • COVID-19
  • Chlamydophila
  • E.Coli
  • Fungal
  • Influenza
  • Klebsiella
  • Legionella
  • Lipoid
  • MERS
  • Mycoplasma
  • No Finding
  • Pneumocystis
  • Pneumonia
  • SARS
  • Streptococcus
  • Varicella
  • Viral

附加注释

  • 肺部边界框和胸部X光分割(许可证:CC BY 4.0)
  • 肺炎严重程度评分(94张图像,许可证:CC BY-SA)
  • 生成的肺部分割(许可证:CC BY-SA)
  • Brixia评分(192张图像,许可证:CC BY-NC-SA)
  • 肺部及其他分割(517张图像,许可证:CC BY)

数据集许可证

  • 图像许可证在metadata.csv中指定,包括Apache 2.0、CC BY-NC-SA 4.0、CC BY 4.0。
  • 元数据、脚本和其他文档的许可证为CC BY-NC-SA 4.0。

联系方式

项目负责人:Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal

引用信息

  • COVID-19 Image Data Collection: Prospective Predictions Are the Future
  • COVID-19 image data collection
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建旨在为COVID-19及其他病毒性和细菌性肺炎的研究提供公开的胸部X光和CT图像资源。数据来源包括公开渠道以及通过医院和医生间接收集的图像。所有图像和相关信息均在该GitHub仓库中公开发布,并已获得蒙特利尔大学伦理委员会的批准。数据标签采用层次化结构,便于分类和分析。
特点
该数据集包含了481例胸部X光图像和173例CT图像,涵盖了多种肺炎类型,如COVID-19、MERS、SARS和ARDS等。每张图像均标注了详细的疾病分类信息,便于研究人员进行多类别分析。此外,数据集还提供了肺部边界框、分割标注以及肺炎严重程度评分等丰富的注释信息,为深度学习模型的训练和验证提供了全面的支持。
使用方法
该数据集可用于开发基于人工智能的COVID-19诊断和预后预测模型。研究人员可以通过加载数据集中的图像和标注信息,训练分类、分割或回归模型。数据集支持多种格式,如DCM、JPG、PNG和NIFTI,便于不同工具的使用。此外,数据集的开源性质允许研究人员进行本地验证和模型优化,推动相关领域的快速进展。
背景与挑战
背景概述
在COVID-19大流行的背景下,蒙特利尔大学的Joseph Paul Cohen及其团队于2020年创建了COVID-19图像数据收集项目,旨在构建一个公开的胸部X光和CT图像数据集,以支持COVID-19及其他病毒性和细菌性肺炎的诊断与研究。该数据集通过公开来源及医院和医生的间接收集,涵盖了COVID-19、MERS、SARS和ARDS等多种肺炎类型的图像。项目获得了蒙特利尔大学伦理委员会的批准,编号为CERSES-20-058-D。该数据集的发布为开发基于人工智能的诊断和预后工具提供了重要基础,推动了COVID-19相关研究的进展。
当前挑战
该数据集在构建过程中面临多重挑战。首先,COVID-19的影像特征与其他肺炎类型存在重叠,导致图像分类和诊断的复杂性增加。其次,数据收集依赖于公开来源和医院合作,数据质量和一致性难以保证。此外,数据集中的图像标注和元数据管理需要高度精确,以确保其在机器学习模型中的有效性。最后,尽管数据集为研究提供了宝贵资源,但其临床应用的验证仍需通过严格的临床研究,以避免误用和误导性结论。
常用场景
经典使用场景
COVID-19图像数据集的经典使用场景主要集中在医学影像分析领域,尤其是在COVID-19疫情的背景下,该数据集被广泛用于训练和验证基于人工智能的肺部影像分析模型。研究人员利用这些X光和CT图像,开发出能够自动检测和分类COVID-19肺炎的算法,帮助医生快速识别患者病情。
实际应用
在实际应用中,COVID-19图像数据集被用于开发临床辅助诊断工具,帮助医生在等待放射科医生分析结果的同时,快速获得患者的影像评估结果。这些工具能够提供定量评分,辅助医生制定治疗方案,并在疫情高峰期缓解医疗资源紧张的问题。
衍生相关工作
基于COVID-19图像数据集,衍生出了多项经典研究工作,如《Predicting COVID-19 Pneumonia Severity on Chest X-ray with Deep Learning》和《Lung Segmentation from Chest X-rays using Variational Data Imputation》。这些研究进一步推动了COVID-19影像分析技术的发展,并为后续研究提供了重要的参考和基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作