five

COVID-19 image data collection

收藏
github2020-10-07 更新2024-05-31 收录
下载链接:
https://github.com/ece7048/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的开放数据库。我们正在寻找COVID-19病例以及MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。目前,我们正在从已有的出版物中收集图像来构建数据库。

We are constructing an open database comprising chest X-ray or CT images of COVID-19 cases. We are seeking cases of COVID-19 as well as MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository. Currently, we are gathering images from existing publications to build the database.
创建时间:
2020-04-16
原始信息汇总

COVID-19影像数据集概述

数据集描述

  • 目的: 构建COVID-19病例的胸部X光或CT图像数据库,包括COVID-19、MERS、SARS和ARDS病例。
  • 数据内容: 包含胸部X光和CT图像,以及相关的元数据。
  • 数据状态: 目前正在构建中,主要从已发表的文献中提取图像。
  • 数据访问: 所有图像和数据将公开发布于GitHub仓库。

数据集统计

  • 样本数量:
    • COVID19_Dataset: 201个样本,视图类型包括PA和AP。
    • COVID19_Dataset: 28个样本,视图类型为AP Supine。
  • 标签分布: 数据集包含多种疾病标签,如COVID-19、Bacterial Pneumonia、Viral Pneumonia等,每个标签有明确的0或1的分类。

数据集贡献

  • 图像来源: 鼓励从出版物中提取图像,特别是未包含在现有数据库中的出版物。
  • 数据提交: 支持从Radiopaedia、SIRM、EURORAD等网站抓取数据。
  • 图像标注: 提供肺部边界框或掩码,用于图像中问题区域的检测。

数据集格式

  • 胸部X光: 首选格式为dcm、jpg或png。
  • CT: 首选格式为nifti(gzip格式),也接受dcm格式。

数据集目标

  • 应用: 开发基于AI的方法来预测和理解感染情况。
  • 平台: 使用开源的Chester AI Radiology Assistant平台,旨在全球范围内本地执行计算。
  • 任务:
    • 健康与肺炎的区分(已有原型,AUC约74%)。
    • 预测患者的生存/预后。

联系方式

  • 负责人: Joseph Paul Cohen, 博士后研究员,Mila,蒙特利尔大学。

数据集引用

  • 论文: COVID-19 image data collection, arXiv:2003.11597, 2020.
  • 作者: Joseph Paul Cohen, Paul Morrison, Lan Dao.
  • 链接: GitHub仓库
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建主要依赖于公开的医学文献和临床影像资料。研究团队通过收集已发表的COVID-19病例的胸部X光片和CT扫描图像,逐步扩充数据库。此外,团队还积极从其他公开资源如Radiopaedia、SIRM和Eurorad等网站获取数据,并鼓励社区贡献者提供额外的图像和标注信息。所有数据均以公开形式发布在GitHub仓库中,确保透明度和可访问性。
特点
该数据集包含了多种呼吸系统疾病的影像数据,如COVID-19、MERS、SARS和ARDS等,涵盖了PA、AP和AP Supine等多种视角的胸部X光片和CT图像。数据集中的每张图像都附有详细的元数据,包括疾病标签和影像视角信息。此外,部分图像还提供了肺部区域的边界框标注,便于进行更精细的病灶检测和分析。数据集的多样性和标注质量使其成为开发AI辅助诊断工具的理想选择。
使用方法
该数据集主要用于开发基于AI的COVID-19诊断和预测模型。研究人员可以通过GitHub获取数据加载器,并使用提供的元数据进行模型训练和验证。数据集支持多种图像格式,如DICOM、JPG和PNG,便于不同研究场景下的应用。此外,数据集还可用于探索COVID-19与其他呼吸系统疾病的影像特征差异,以及评估患者预后情况。通过公开的数据和工具,研究团队希望推动全球范围内的AI辅助诊断技术发展。
背景与挑战
背景概述
COVID-19图像数据收集数据集由Joseph Paul Cohen、Paul Morrison和Lan Dao等人于2020年创建,旨在构建一个包含COVID-19病例的胸部X光或CT图像的数据库。该数据集不仅涵盖COVID-19病例,还包括中东呼吸综合征(MERS)、严重急性呼吸综合征(SARS)以及急性呼吸窘迫综合征(ARDS)等疾病的图像。这些图像主要来源于已发表的文献,数据公开于GitHub平台,供全球研究人员使用。该数据集的创建背景源于COVID-19疫情的迅速蔓延,亟需通过影像学手段辅助诊断,以弥补核酸检测的局限性。通过提供开放的图像数据,该数据集为开发基于人工智能的诊断工具奠定了基础,推动了医学影像分析领域的研究进展。
当前挑战
COVID-19图像数据收集数据集在构建和应用过程中面临多重挑战。首先,数据集的构建依赖于已发表的文献图像,这导致数据来源有限且可能存在图像质量不一致的问题。其次,COVID-19的影像学表现与其他肺炎类型(如细菌性肺炎、病毒性肺炎)存在重叠,增加了图像分类和诊断的难度。此外,数据集中部分类别的样本数量较少,可能导致模型训练时的偏差。在应用层面,尽管AI工具在辅助诊断方面具有潜力,但其临床有效性仍需通过严格的临床研究验证,以避免误诊或漏诊的风险。最后,数据集的扩展和维护需要持续的努力,包括从更多来源获取高质量图像,并提供详细的标注信息以支持更复杂的分析任务。
常用场景
经典使用场景
COVID-19图像数据集合在医学影像分析领域具有重要应用,特别是在胸部X光和CT图像的自动诊断系统中。该数据集被广泛用于训练和验证深度学习模型,以识别COVID-19患者的肺部影像特征。通过对比健康患者与肺炎患者的影像数据,研究人员能够开发出高效的算法,用于辅助医生进行快速诊断。
衍生相关工作
基于COVID-19图像数据集合,许多经典研究工作得以展开。例如,研究人员开发了多种深度学习模型,用于自动检测COVID-19的影像特征。这些模型在多个临床环境中进行了验证,并展示了较高的诊断准确性。此外,该数据集还促进了多中心合作研究,推动了COVID-19影像诊断技术的标准化和普及。
数据集最近研究
最新研究方向
在COVID-19疫情的背景下,胸部X光和CT影像数据集的构建与分析成为医学影像领域的前沿研究方向。该数据集不仅包含了COVID-19病例的影像,还涵盖了MERS、SARS和ARDS等其他呼吸道疾病的影像数据,为研究者提供了丰富的对比材料。当前的研究热点集中在利用深度学习模型进行影像分类与诊断,尤其是通过AI技术辅助医生进行肺炎类型的区分和患者预后的预测。这些研究不仅有助于提高诊断的准确性和效率,还能在医疗资源紧张的情况下,为临床决策提供支持。此外,数据集的公开共享促进了全球科研合作,推动了AI在医学影像领域的应用与发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作