five

COVID-19 image data collection

收藏
github2020-09-09 更新2024-05-31 收录
下载链接:
https://github.com/Zakhaisy/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。数据来源于公共资源及医院和医生的间接收集,所有图像和数据在此GitHub仓库公开发布。

Construct a publicly accessible open dataset comprising chest X-rays and CT images of COVID-19 positive or suspected patients, along with images of other viral and bacterial pneumonias. The data is sourced from public resources and indirectly collected from hospitals and physicians. All images and data are publicly released in this GitHub repository.
创建时间:
2020-09-09
原始信息汇总

COVID-19 Image Data Collection

Project Summary

The project aims to build a public open dataset of chest X-ray and CT images of patients positive or suspected of COVID-19, as well as other viral and bacterial pneumonias such as MERS, SARS, and ARDS. Data is collected from public sources and indirectly from hospitals and physicians. All images and data are released publicly on GitHub.

Data and Metadata

  • Images: Available in the images directory.
  • Metadata: Available in metadata.csv.
  • Label Hierarchy: Labels are arranged hierarchically as depicted in the image docs/hierarchy.jpg.

Dataset Statistics

  • COVID19_Dataset:
    • Num_samples=481: Views include PA and AP.
    • Num_samples=173: Views include AP Supine.

Annotations

  • Lung Bounding Boxes and Chest X-ray Segmentation: Contributed by General Blockchain, Inc. under CC BY 4.0.
  • Pneumonia Severity Scores: Available for 94 images under CC BY-SA.
  • Generated Lung Segmentations: Available under CC BY-SA.
  • Brixia Score: Available for 192 images under CC BY-NC-SA.
  • Lung and Other Segmentations: Available for 517 images under CC BY.

Contribution

  • Data Submission: Directly to the project following the research protocol.
  • Image Extraction from Publications: Help identify publications not already included.
  • Data from Other Sites: Data can be scraped from sites like Radiopaedia, SIRM, Eurorad, and Coronacases.
  • Bounding Box/Masks: For detection of problematic regions in collected images.

Background

The dataset aims to improve prognostic predictions for triaging and managing patient care during the COVID-19 pandemic. It complements existing public datasets by focusing specifically on COVID-19 chest X-rays and CT scans.

Goal

The goal is to develop AI-based approaches using these images to predict and understand the infection. The models will be released using the open-source Chester AI Radiology Assistant platform.

Expected Outcomes

  • Tool Impact: Provide physicians with a digital second opinion and quantitative scores for patient assessments.
  • Data Impact: Enable parallel development of tools and rapid local validation of models.

Contact

PI: Joseph Paul Cohen, Postdoctoral Fellow, Mila, University of Montreal.

License

  • Images: License specified in metadata.csv (Apache 2.0, CC BY-NC-SA 4.0, CC BY 4.0).
  • Metadata, Scripts, Documents: Released under CC BY-NC-SA 4.0.
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建旨在为COVID-19及其他病毒性和细菌性肺炎的胸部X光和CT图像提供一个公开的开放数据集。数据来源包括公开资源以及通过医院和医生间接收集的图像。所有图像和数据均通过GitHub仓库公开发布,并获得了蒙特利尔大学伦理委员会的批准(#CERSES-20-058-D)。数据集的构建过程遵循严格的伦理标准,确保数据的合法性和透明性。
使用方法
该数据集可用于开发基于人工智能的诊断和预后预测模型。研究人员可以使用胸部X光或CT图像作为输入,进行健康与肺炎的分类、肺炎类型的区分以及预后预测等任务。数据集中的注释信息可用于训练和验证图像分割、目标检测等计算机视觉任务。此外,数据集还提供了多个基线模型的源代码,研究人员可以在此基础上进行进一步的开发和优化。数据集的使用需遵循相应的许可协议,确保研究的合法性和透明性。
背景与挑战
背景概述
COVID-19 image data collection 数据集由蒙特利尔大学的 Joseph Paul Cohen 及其团队于2020年创建,旨在为COVID-19及其他病毒性和细菌性肺炎的胸部X光和CT图像提供一个公开的数据集。该数据集通过公开来源和医院、医生的间接收集方式构建,涵盖了多种肺炎类型的图像数据。其核心研究问题在于通过计算分析提升COVID-19的诊断和预后预测能力,为临床决策提供支持。该数据集在医学影像分析和人工智能领域具有重要影响力,推动了COVID-19相关研究的进展。
当前挑战
该数据集面临的挑战主要包括两个方面。首先,在领域问题方面,尽管胸部X光和CT图像在COVID-19诊断中具有重要价值,但其图像特征与其它肺炎类型存在重叠,导致分类和预测模型的准确性受到限制。其次,在数据集构建过程中,数据的收集和标注面临诸多困难,例如图像来源的多样性、数据格式的不一致性以及隐私保护问题。此外,由于COVID-19疫情的紧迫性,数据集的快速构建和更新也对研究团队提出了更高的要求。
常用场景
经典使用场景
COVID-19图像数据集的经典使用场景主要集中在医学影像分析领域,尤其是通过胸部X光和CT扫描图像来识别和区分COVID-19与其他病毒性或细菌性肺炎。该数据集为研究人员提供了一个丰富的图像库,用于训练和验证深度学习模型,以自动检测和分类肺部病变。通过结合临床数据,该数据集还可用于研究COVID-19的影像特征及其与其他肺部疾病的差异。
解决学术问题
该数据集解决了COVID-19诊断中的关键学术问题,尤其是在缺乏大规模标注数据的情况下,为研究人员提供了一个公开的、多样化的图像数据集。通过该数据集,研究人员能够开发出更精确的AI模型,用于区分COVID-19与其他肺炎类型,并预测疾病的严重程度。此外,该数据集还为研究COVID-19的影像学特征及其与临床预后的关系提供了重要支持。
实际应用
在实际应用中,COVID-19图像数据集被广泛用于开发辅助诊断工具,帮助医生在临床环境中快速识别COVID-19患者。这些工具可以为医生提供第二意见,尤其是在资源有限的地区,能够显著提高诊断效率和准确性。此外,该数据集还被用于开发预后模型,预测患者的病情进展,从而优化治疗方案和资源分配。
数据集最近研究
最新研究方向
在COVID-19大流行的背景下,胸部X光和CT图像的分析成为了研究热点。COVID-19 Image Data Collection数据集为研究者提供了一个开放的资源,用于开发和验证基于人工智能的诊断和预后工具。当前的研究方向主要集中在利用深度学习技术对胸部影像进行自动分析,以区分健康与肺炎病例,并预测COVID-19患者的病情严重程度。此外,研究者们还在探索如何通过这些影像数据预测患者的生存率、是否需要插管或补充氧气等关键临床决策。这些研究不仅有助于提高诊断的准确性,还能在临床决策中提供量化的支持,从而优化患者的治疗和管理策略。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作