five

COVID-19-X-ray-Dataset|医疗影像数据集|深度学习数据集

收藏
github2022-02-22 更新2024-05-31 收录
医疗影像
深度学习
下载链接:
https://github.com/rgbnihal2/COVID-19-X-ray-Dataset
下载链接
链接失效反馈
资源简介:
该数据集是通过整合来自四个不同来源的X光图像创建的,用于深度学习模型自动检测COVID-19、正常和肺炎情况。

This dataset was created by integrating X-ray images from four different sources, designed for deep learning models to automatically detect COVID-19, normal conditions, and pneumonia.
创建时间:
2020-07-19
原始信息汇总

COVID-19-X-ray-Dataset 概述

数据集来源

  • https://github.com/ieee8023/covid-chestxray-dataset
  • https://github.com/agchung/Figure1-COVID-chestxray-dataset
  • https://github.com/agchung/Actualmed-COVID-chestxray-dataset
  • https://www.kaggle.com/tawsifurrahman/covid19-radiography-database

数据集内容

该数据集包含用于COVID-19、正常和肺炎诊断的X光图像,用于深度学习模型的训练和测试。

研究方法

本研究对基于深度学习的COVID-19自动检测进行了详细调查,包括方法论挑战、可能的解决方案及未来探索的领域。进行了315个深度模型在诊断COVID-19、正常和肺炎方面的性能的比较定量分析。

研究结果

研究结果显示,使用DenseNet201模型结合Quadratic SVM分类器表现最佳,准确率达到98.16%,敏感性为98.93%,特异性为98.77%。

结论

本研究提供了一个全面的指南,希望为该领域的研究人员提供帮助。

AI搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19-X-ray-Dataset的构建基于四个公开的胸部X光图像数据集,通过整合和筛选,形成了一个专门用于COVID-19检测的自定义数据集。该数据集涵盖了COVID-19、正常和肺炎三类X光图像,旨在为深度学习模型提供多样化的训练样本。数据集的构建过程包括图像收集、标签标注以及数据清洗,确保了数据的质量和一致性。通过这种方式,数据集能够为研究者提供一个可靠的基础,用于开发和验证自动化COVID-19检测算法。
特点
该数据集的特点在于其多样性和广泛性,涵盖了COVID-19、正常和肺炎三类X光图像,能够为深度学习模型提供全面的训练和测试环境。数据集中的图像经过精心筛选和标注,确保了数据的准确性和一致性。此外,数据集还提供了详细的性能评估结果,展示了不同深度学习模型在COVID-19检测中的表现,为研究者提供了宝贵的参考信息。通过这些特点,数据集能够有效支持自动化COVID-19检测算法的开发和优化。
使用方法
使用COVID-19-X-ray-Dataset时,研究者可以通过GitHub页面下载数据集,并利用提供的代码和模型进行实验。数据集适用于多种深度学习框架,研究者可以根据需要选择合适的模型进行训练和测试。在使用过程中,建议先对数据进行预处理,如图像归一化和增强,以提高模型的性能。此外,数据集还提供了详细的性能评估结果,研究者可以参考这些结果进行模型选择和优化。通过这种方式,数据集能够为研究者提供一个全面的工具,用于开发和验证自动化COVID-19检测算法。
背景与挑战
背景概述
COVID-19-X-ray-Dataset数据集诞生于2020年,正值全球COVID-19疫情肆虐之际。该数据集由Rahman等人及其研究团队创建,旨在通过深度学习技术实现COVID-19的自动化检测。数据集整合了来自多个公开资源的胸部X光影像,包括COVID-19、正常和肺炎病例,为研究者提供了一个全面的基准。其核心研究问题在于探索如何利用人工智能技术,尤其是深度学习模型,从X光影像中高效、准确地识别COVID-19感染。这一研究不仅推动了医学影像分析领域的发展,也为全球疫情防控提供了重要的技术支持。
当前挑战
COVID-19-X-ray-Dataset面临的挑战主要集中在两个方面。首先,在领域问题方面,尽管X光影像在COVID-19检测中具有潜力,但其影像特征与肺炎等其他疾病存在重叠,导致分类难度较高。其次,在数据集构建过程中,研究人员需要整合来自不同来源的影像数据,这些数据在质量、格式和标注标准上存在显著差异,增加了数据清洗和标准化的复杂性。此外,由于COVID-19疫情的快速演变,数据集的时效性和覆盖范围也成为构建过程中的一大挑战。这些问题的解决对于提升模型的泛化能力和实际应用价值至关重要。
常用场景
经典使用场景
COVID-19-X-ray-Dataset数据集在医学影像分析领域具有重要的应用价值,尤其是在COVID-19的早期检测和诊断中。该数据集通过整合多个公开的胸部X光影像数据源,为研究人员提供了一个统一的平台,用于开发和测试基于深度学习的自动化诊断模型。其经典使用场景包括训练和验证深度学习模型,以区分COVID-19、正常和肺炎病例的X光影像,从而辅助临床决策。
实际应用
在实际应用中,COVID-19-X-ray-Dataset已被广泛用于开发智能诊断系统,帮助医疗机构快速筛查COVID-19患者。例如,基于该数据集训练的深度学习模型可以集成到医院的信息系统中,自动分析患者的X光影像,生成初步诊断报告,从而减轻医生的工作负担。此外,该数据集还被用于开发移动端应用,使偏远地区的医疗工作者能够通过简单的设备进行COVID-19筛查。
衍生相关工作
该数据集衍生了许多经典的研究工作,特别是在深度学习与医学影像分析的交叉领域。例如,基于该数据集的研究提出了多种改进的深度学习架构,如DenseNet201与Quadratic SVM的结合,显著提升了COVID-19检测的准确率。此外,该数据集还推动了多模态医学影像分析的研究,结合CT影像与X光影像,进一步提高了诊断的可靠性。这些工作不仅推动了COVID-19诊断技术的发展,也为其他传染病的自动化检测提供了参考。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

微博与抖音评论数据集

数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。

github 收录