five

COVID19-DATASET

收藏
github2021-02-21 更新2024-05-31 收录
下载链接:
https://github.com/amrrashed/COVID19-DATASET
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集收集了胸部X光和CT图像,包含四个主要部分:原始数据集(分为正常、病毒、COVID-19和细菌四类X光图像)、CT数据集(分为正常和COVID-19两类,其中正常文件夹为空)、真实测试案例(包含10张确诊为COVID-19的X光图像)和调整大小的数据集(所有图像调整为224x224像素,适合用于预训练模型)。

This dataset comprises chest X-ray and CT images, organized into four primary sections: the original dataset (categorized into normal, viral, COVID-19, and bacterial X-ray images), the CT dataset (divided into normal and COVID-19 categories, with the normal folder being empty), real test cases (including 10 X-ray images confirmed as COVID-19), and a resized dataset (all images adjusted to 224x224 pixels, suitable for pre-training models).
创建时间:
2020-03-28
原始信息汇总

COVID19-DATASET 概述

数据集结构

  • 原始数据集:包含四个子文件夹,分别存放不同类型的胸部X光图像。

    • 正常:128张正常胸部X光图像,来源:https://www.kaggle.com/paultimothymooney/chest-xray-pneumonia
    • 病毒:128张病毒胸部X光图像,来源:https://www.kaggle.com/paultimothymooney/chest-xray-pneumonia
    • COVID:128张COVID胸部X光图像,来源:https://github.com/ieee8023/covid-chestxray-dataset
    • 细菌:128张细菌胸部X光图像,来源:https://www.kaggle.com/paultimothymooney/chest-xray-pneumonia
  • CT数据集:包含两个子文件夹。

    • 正常:文件夹为空。
    • COVID:包含20张CT图像,来源:https://github.com/ieee8023/covid-chestxray-dataset,以及3张由医生提供的图像。
  • 真实测试案例:包含10张被诊断为COVID-19的真实X光图像,由医生提供。

  • 调整大小后的数据集:原始数据集的新版本,所有图像已调整为224x224像素,适用于预训练模型。

数据集链接

数据集可通过以下链接访问: https://www.dropbox.com/sh/ior4ij1wp0z8s71/AABYnuU-3VQlStWdHBcWbwr0a?dl=0

搜集汇总
数据集介绍
main_image_url
构建方式
COVID19-DATASET数据集的构建基于公开的医学影像资源,主要包含胸部X光和CT图像。数据集的构建过程涉及从多个公开数据源收集图像,包括Kaggle和GitHub上的特定项目。为确保数据的多样性和代表性,收集过程中特别选择了RGB格式的X光图像,而非灰度图像。此外,数据集还包含由医生提供的真实病例图像,增强了数据的临床相关性。
使用方法
COVID19-DATASET的使用方法主要围绕医学影像分析展开。研究人员可以利用该数据集进行COVID-19的自动检测和分类研究,特别是在使用深度学习模型时。数据集中的调整大小后的图像可以直接用于训练和测试预训练模型,而真实测试案例则可用于验证模型的临床适用性。使用该数据集时,研究者应注意避免未经临床研究就宣称模型的诊断性能,以确保研究的科学性和伦理性。
背景与挑战
背景概述
COVID19-DATASET是一个专注于收集胸部X光和CT图像的公开数据集,旨在为COVID-19相关研究提供支持。该数据集由多个来源的图像组成,包括Kaggle和GitHub等平台,涵盖了正常、病毒、细菌和COVID-19感染的四类胸部X光图像。数据集创建于2020年,正值全球COVID-19疫情爆发期间,其主要研究人员和机构未在README中明确提及,但其数据来源包括IEEE 8023等知名研究项目。该数据集的核心研究问题是通过医学影像分析辅助COVID-19的诊断,为深度学习模型的训练和验证提供了重要资源。其对医学影像分析和传染病诊断领域的研究具有重要推动作用。
当前挑战
COVID19-DATASET在解决COVID-19医学影像分类问题时面临多重挑战。首先,数据集的多样性和规模有限,尽管包含多种类型的胸部X光和CT图像,但每类样本数量较少,可能影响模型的泛化能力。其次,数据来源的异质性导致图像质量和格式不一致,增加了数据预处理的复杂性。此外,数据集构建过程中面临图像标注的准确性挑战,尤其是在COVID-19病例的标注上,缺乏临床验证可能影响模型的可靠性。最后,数据集的非标准化格式和部分文件夹的空缺(如CT数据集中的正常文件夹)进一步增加了使用难度。这些挑战限制了数据集在临床诊断中的直接应用,需进一步优化和扩展。
常用场景
经典使用场景
COVID19-DATASET数据集在医学影像分析领域具有重要应用,尤其是在COVID-19的早期诊断中。该数据集包含了大量的胸部X光和CT影像,研究人员可以利用这些影像数据训练深度学习模型,以区分正常、病毒性肺炎、细菌性肺炎和COVID-19感染。通过这种方式,数据集为医学影像的自动化分析提供了宝贵的资源,帮助医生更快速、准确地识别COVID-19病例。
解决学术问题
COVID19-DATASET解决了医学影像分析中的关键问题,特别是在COVID-19诊断中的挑战。由于COVID-19的影像特征与其他类型的肺炎相似,传统的诊断方法往往难以区分。该数据集通过提供大量标注的影像数据,使得研究人员能够开发出更精确的深度学习模型,从而提升诊断的准确性和效率。这一突破不仅推动了医学影像分析技术的发展,也为全球抗击COVID-19提供了有力的技术支持。
实际应用
在实际应用中,COVID19-DATASET被广泛用于开发自动化诊断工具。这些工具可以帮助医疗机构在资源有限的情况下,快速筛查COVID-19患者,减轻医疗系统的负担。特别是在疫情高峰期,自动化诊断系统能够显著提高诊断速度,减少医生的工作压力。此外,该数据集还被用于研究COVID-19的影像特征,帮助医生更好地理解疾病的进展和影响。
数据集最近研究
最新研究方向
随着全球范围内COVID-19疫情的持续影响,医学影像分析在疾病诊断中的重要性日益凸显。COVID19-DATASET作为一个包含胸部X光和CT图像的集合,为研究者提供了丰富的资源,以探索深度学习模型在COVID-19检测中的应用。当前的研究方向主要集中在利用预训练模型进行图像分类和特征提取,以提高诊断的准确性和效率。此外,该数据集还支持跨域学习的研究,即通过已有的正常和病毒性肺炎图像数据,增强模型对COVID-19的识别能力。这些研究不仅推动了医学影像技术的进步,也为全球疫情防控提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作