five

COVID-19 image data collection

收藏
github2020-06-19 更新2024-05-31 收录
下载链接:
https://github.com/bganglia/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。

Construct a publicly accessible open dataset comprising chest X-ray and CT images of COVID-19 positive or suspected patients, along with images of other viral and bacterial pneumonias.
创建时间:
2020-03-10
原始信息汇总

COVID-19图像数据集概述

数据集描述

  • 项目名称: COVID-19图像数据收集
  • 数据类型: 胸部X光和CT图像
  • 样本描述: 包含COVID-19阳性患者、疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS、ARDS)的图像。
  • 数据来源: 公共来源及医院和医生的间接收集
  • 数据发布: 所有图像和数据公开发布于GitHub仓库
  • 伦理批准: 蒙特利尔大学伦理委员会批准,编号CERSES-20-058-D

数据集统计

  • COVID19_Dataset:

    • 样本数: 408
    • 视图类型: [PA, AP]
    • 标签: 0=无, 1=有
    • 疾病分布: 详见README文件中的疾病分布统计
  • COVID19_Dataset:

    • 样本数: 134
    • 视图类型: [AP Supine]
    • 标签: 0=无, 1=有
    • 疾病分布: 详见README文件中的疾病分布统计

注释信息

数据集用途

  • 目标: 利用这些图像开发基于AI的方法来预测和理解感染
  • 任务: 包括健康与肺炎的区分、预后/严重性预测(生存、需要插管、需要补充氧气)
  • 预期成果: 为医生提供辅助决策工具,同时支持模型的快速本地验证和不同任务的数据使用

联系方式

  • 项目负责人: Joseph Paul Cohen, 蒙特利尔大学博士后研究员

许可证

  • 图像: 每个图像的许可证在metadata.csv文件中指定,包括Apache 2.0, CC BY-NC-SA 4.0, CC BY 4.0
  • metadata.csv及其他文档: 发布于CC BY-NC-SA 4.0许可证下
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建主要依赖于公开来源的数据收集,同时通过医院和医生的间接贡献进行补充。数据集涵盖了胸部X光和CT图像,这些图像来自确诊或疑似COVID-19及其他病毒性和细菌性肺炎的患者。所有图像和数据均通过GitHub仓库公开发布,并获得了蒙特利尔大学伦理委员会的批准。
特点
该数据集包含了408例PA、AP视图和134例AP仰卧视图的胸部X光图像,每张图像均标注了是否患有COVID-19及其他相关疾病。数据集的特点在于其多样性和广泛性,涵盖了多种肺炎类型,如细菌性肺炎、病毒性肺炎以及COVID-19等。此外,数据集还提供了肺部边界框、肺炎严重程度评分等丰富的注释信息,为深度学习模型的训练和验证提供了坚实的基础。
使用方法
该数据集的使用方法包括通过GitHub仓库下载图像和元数据文件,利用提供的Python数据加载器进行数据预处理和模型训练。研究人员可以使用这些数据开发基于AI的诊断和预后预测工具,特别是针对COVID-19的肺部影像分析。数据集的使用需遵循相应的许可协议,确保在研究和商业应用中的合规性。
背景与挑战
背景概述
COVID-19图像数据收集项目由蒙特利尔大学的Joseph Paul Cohen等人于2020年发起,旨在构建一个公开的胸部X光和CT图像数据集,涵盖COVID-19及其他病毒性和细菌性肺炎患者的影像数据。该数据集通过公开来源和医院间接收集数据,并经蒙特利尔大学伦理委员会批准。其核心研究问题在于通过计算分析提升COVID-19的诊断和预后预测能力,为临床决策提供支持。该数据集填补了COVID-19影像数据在计算分析领域的空白,推动了基于人工智能的医学影像研究,尤其在疫情初期为全球科研人员提供了宝贵资源。
当前挑战
该数据集在构建和应用过程中面临多重挑战。首先,COVID-19影像特征与其他肺炎类型存在重叠,导致分类模型在区分病毒性、细菌性和COVID-19肺炎时表现不佳。其次,数据收集过程中涉及隐私保护和伦理审查,限制了数据的获取速度和规模。此外,影像数据的标注质量参差不齐,部分图像缺乏详细的临床信息,影响了模型的训练效果。最后,尽管数据集旨在支持预后预测,但临床验证的缺乏使得模型的实际应用效果难以评估,亟需进一步的临床研究支持。
常用场景
经典使用场景
COVID-19图像数据集在医学影像分析领域具有重要应用,尤其是在胸部X光和CT图像的自动诊断中。该数据集被广泛用于训练深度学习模型,以区分COVID-19与其他病毒性和细菌性肺炎。通过提供大量标注的影像数据,研究人员能够开发出高效的算法,用于早期检测和病情评估。
衍生相关工作
基于该数据集,多项经典研究工作得以展开。例如,研究者开发了用于预测COVID-19肺炎严重程度的深度学习模型,并提出了基于影像的预后评估方法。此外,该数据集还推动了肺部区域分割和病变检测算法的研究,为医学影像分析领域提供了新的技术路径。
数据集最近研究
最新研究方向
在COVID-19大流行的背景下,胸部X光和CT影像数据集的研究方向主要集中在利用人工智能技术进行肺炎的早期诊断和预后预测。当前的研究热点包括开发能够区分健康与肺炎、细菌性与病毒性肺炎的深度学习模型,以及预测患者是否需要插管或补充氧气的严重程度评分系统。这些研究不仅有助于提高临床决策的准确性,还能在放射科医生分析结果之前为医生提供数字化的第二意见,从而加速患者的治疗进程。此外,该数据集还被用于探索不同肺炎类型之间的影像特征差异,以及如何通过影像数据预测患者的生存率,这些研究对于优化医疗资源的分配和提高患者护理质量具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作