five

COVID-19 image data collection

收藏
github2020-09-11 更新2024-05-31 收录
下载链接:
https://github.com/Onr/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
我们正在构建一个包含COVID-19病例的胸部X光或CT图像的数据库,同时也在寻找MERS、SARS和ARDS的病例。所有图像和数据将在此GitHub仓库中公开发布。

We are constructing a database comprising chest X-ray or CT images of COVID-19 cases, while also seeking cases of MERS, SARS, and ARDS. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-03-19
原始信息汇总

COVID-19 影像数据集概述

数据集内容

  • 类型: 胸部X光或CT图像数据集。
  • 目标疾病: COVID-19, MERS, SARS, ARDS。
  • 数据状态: 图像和数据将公开发布于GitHub仓库。
  • 当前数据统计: 包含多种疾病的图像和元数据,标签为0(无)或1(有)。

数据集结构

  • 图像: 可通过链接查看当前图像。
  • 元数据: 可通过链接查看当前元数据文件(metadata.csv)。

数据集用途

  • 目标: 利用这些图像开发基于AI的方法来预测和理解感染情况。
  • 应用: 用于开发AI模型,预测健康与肺炎、细菌性与病毒性及COVID-19肺炎、患者生存情况。

贡献方式

  • 图像来源: 从已发表的文献中提取图像。
  • 数据提交: 可提交数据至特定网站,如https://radiopedia.org/或https://www.sirm.org/category/senza-categoria/covid-19/。
  • 数据标注: 提供已收集图像中问题区域的边界框/掩码。

数据格式

  • 胸部X光: 首选格式为dcm, jpg, png。
  • CT: 首选格式为nifti(gzip格式),也接受dcm格式。
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建主要依赖于从已发表的文献中提取胸部X光或CT图像。这些图像经过筛选和整理,涵盖了COVID-19、MERS、SARS以及ARDS等多种呼吸道疾病的病例。数据集的构建过程注重公开透明,所有图像和元数据均通过GitHub平台公开发布,便于全球研究者的访问和使用。
特点
该数据集的特点在于其多样性和广泛性,不仅包含COVID-19病例,还涵盖了其他呼吸道疾病的图像数据。数据集中的图像经过标准化处理,确保了数据的一致性和可比性。此外,数据集还提供了详细的元数据,包括病例标签(0表示无,1表示有),便于研究者进行精确的疾病分类和预测。
使用方法
数据集的使用方法相对简便,研究者可以通过GitHub页面直接访问图像和元数据文件。数据集还提供了数据加载器,支持使用Python的torchxrayvision库进行数据加载和处理。研究者可以利用这些数据开发基于AI的疾病预测模型,特别是在COVID-19的早期检测和分类方面。此外,数据集还鼓励研究者通过提交新的图像数据或提供图像中的问题区域标注来进一步丰富数据集。
背景与挑战
背景概述
COVID-19 image data collection 数据集由Joseph Paul Cohen及其团队于2020年初创建,旨在通过收集胸部X光片和CT图像,构建一个公开的COVID-19病例数据库。该数据集不仅包含COVID-19病例,还涵盖了MERS、SARS和ARDS等其他呼吸道疾病的图像。数据集的主要研究问题是通过放射影像学手段提高COVID-19的诊断准确性,尤其是在PCR检测资源有限的情况下,辅助医疗人员进行快速筛查和诊断。该数据集对医学影像分析和人工智能在医疗诊断中的应用具有重要影响,推动了相关领域的研究进展。
当前挑战
该数据集面临的主要挑战包括:1) 数据多样性不足,尤其是COVID-19病例的图像数量相对较少,可能导致模型训练时的偏差;2) 图像标注的准确性依赖于医学专家的判断,可能存在主观性和不一致性;3) 数据来源的多样性有限,主要依赖于已发表的文献,可能无法覆盖所有临床场景;4) 数据格式和标准的统一性,不同来源的图像可能采用不同的格式和分辨率,增加了数据预处理的复杂性。此外,构建过程中还需解决图像隐私保护和数据共享的伦理问题。
常用场景
经典使用场景
COVID-19 image data collection数据集在医学影像分析领域具有重要应用,尤其是在COVID-19的诊断和研究中。该数据集通过收集胸部X光和CT图像,为研究人员提供了丰富的视觉数据,用于训练和验证基于人工智能的诊断模型。这些模型能够自动识别COVID-19的特征,帮助医生快速筛查患者,尤其是在医疗资源紧张的情况下。
实际应用
在实际应用中,COVID-19 image data collection数据集已被广泛用于开发AI辅助诊断工具。这些工具可以在医院中部署,帮助医生快速筛查COVID-19患者,尤其是在疫情高峰期或医疗资源匮乏的地区。此外,该数据集还被用于研究COVID-19的影像特征,帮助医生更好地理解疾病的进展和预后,从而制定更有效的治疗方案。
衍生相关工作
基于COVID-19 image data collection数据集,许多经典的研究工作得以展开。例如,研究人员开发了多种深度学习模型,用于自动检测COVID-19的影像特征,并在公开平台上发布了这些模型。此外,该数据集还促进了多中心合作研究,推动了全球范围内的COVID-19影像数据分析,为未来的公共卫生危机应对提供了宝贵的经验和数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作