five

COVID-19 image data collection

收藏
github2020-09-20 更新2024-05-31 收录
下载链接:
https://github.com/erichilarysmithsr/covid-chestxray-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
构建一个公开的开放数据集,包含COVID-19阳性或疑似患者的胸部X光和CT图像,以及其他病毒性和细菌性肺炎的图像。数据来源于公共资源及医院和医生的间接收集,所有图像和数据将在此GitHub仓库公开发布。

Construct a publicly accessible open dataset comprising chest X-ray and CT images of COVID-19 positive or suspected patients, along with images of other viral and bacterial pneumonias. The data is sourced from public resources and indirectly collected from hospitals and physicians. All images and data will be publicly released in this GitHub repository.
创建时间:
2020-08-13
原始信息汇总

COVID-19 Image Data Collection

数据集概述

  • 项目目的: 构建一个公开的开放数据集,包含COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎(如MERS、SARS、ARDS)的胸部X光和CT图像。
  • 数据来源: 数据来自公共资源以及通过医院和医生的间接收集。
  • 数据公开: 所有图像和数据将在此GitHub仓库公开发布。
  • 伦理批准: 该项目已获得蒙特利尔大学伦理委员会的批准(CERSES-20-058-D)。

数据集统计

  • COVID19_Dataset:
    • 样本数量: 481个样本
    • 视图类型: [PA, AP]
    • 标签: 0=无, 1=有
  • COVID19_Dataset (AP Supine视图):
    • 样本数量: 173个样本
    • 视图类型: [AP Supine]
    • 标签: 0=无, 1=有

注释信息

  • 肺部边界框: 由General Blockchain, Inc.提供,许可证为CC BY 4.0。
  • 胸部X光分割: 由General Blockchain, Inc.提供,许可证为CC BY 4.0。
  • 肺炎严重程度评分: 94个图像的评分,许可证为CC BY-SA。
  • 自动生成的肺部分割: 许可证为CC BY-SA。
  • Brixia评分: 192个图像的评分,许可证为CC BY-NC-SA。
  • 肺部及其他分割: 517个图像的分割,许可证为CC BY。

数据集贡献

  • 数据提交: 可以直接向项目提交数据,需遵循研究协议。
  • 图像提取: 可以从出版物中提取图像,帮助识别未包含的出版物。
  • 数据格式: 胸部X光图像偏好格式为dcm, jpg, png;CT扫描偏好格式为nifti(gzip格式)或dcm。

许可证

  • 图像: 每个图像的许可证在metadata.csv文件中指定,包括Apache 2.0, CC BY-NC-SA 4.0, CC BY 4.0。
  • 元数据和其他文档: 发布在CC BY-NC-SA 4.0许可证下。
搜集汇总
数据集介绍
main_image_url
构建方式
COVID-19图像数据集的构建旨在收集公开来源的胸部X光和CT图像,涵盖COVID-19阳性或疑似患者以及其他病毒性和细菌性肺炎病例。数据通过间接收集方式从医院和医生处获取,并经过蒙特利尔大学伦理委员会的批准(#CERSES-20-058-D)。所有图像和元数据均公开发布于GitHub仓库,支持全球研究人员的访问和使用。
使用方法
该数据集可用于训练和验证AI模型,以预测肺炎类型、评估疾病严重程度及预后情况。研究人员可通过GitHub获取图像和元数据,并使用提供的Python数据加载器进行预处理。数据集支持多种格式,如DICOM、JPEG和PNG,适用于深度学习框架。此外,数据集还提供了肺部边界框和分割掩码,可用于目标检测和图像分割任务。
背景与挑战
背景概述
COVID-19 image data collection 数据集由蒙特利尔大学的 Joseph Paul Cohen 等人于2020年创建,旨在为COVID-19及其他病毒性和细菌性肺炎的胸部X光和CT图像提供一个公开的开放数据集。该数据集通过公开来源和医院、医生的间接收集构建,涵盖了多种肺炎类型的图像数据,并已获得蒙特利尔大学伦理委员会的批准。该数据集的创建背景源于COVID-19大流行期间,亟需通过影像数据提升预后预测能力,以优化患者护理和分流管理。尽管已有多个胸部X光公共数据集,但专门用于COVID-19影像计算分析的数据集尚属首次。该数据集为开发基于人工智能的诊断和预后工具提供了重要基础,推动了相关领域的研究进展。
当前挑战
COVID-19 image data collection 数据集在构建和应用中面临多重挑战。首先,数据收集过程中需确保图像质量和标注的准确性,尤其是在不同来源和格式的数据整合中,数据标准化和一致性成为关键问题。其次,COVID-19影像特征与其他肺炎类型存在重叠,如何有效区分并提取特异性特征是一个技术难点。此外,数据集的规模相对有限,尤其是某些类别的样本数量较少,可能导致模型训练中的偏差问题。最后,尽管数据集为AI模型开发提供了基础,但其临床应用的验证仍需严格的临床研究支持,以避免误用或过度依赖。这些挑战不仅影响了数据集的构建质量,也对后续研究提出了更高的要求。
常用场景
经典使用场景
COVID-19图像数据集的经典使用场景主要集中在医学影像分析领域,尤其是通过胸部X光和CT图像进行COVID-19的检测与诊断。该数据集为研究人员提供了丰富的图像数据,涵盖了COVID-19、其他病毒性肺炎和细菌性肺炎的病例。这些数据被广泛应用于训练和验证深度学习模型,以区分健康患者与肺炎患者,并进一步识别COVID-19的特异性影像特征。通过该数据集,研究人员能够开发出高效的AI辅助诊断工具,帮助医生在临床实践中快速识别COVID-19病例。
解决学术问题
该数据集解决了COVID-19诊断中的关键学术问题,特别是在缺乏大规模、高质量医学影像数据的情况下,如何构建可靠的AI模型进行疾病检测。通过提供多样化的COVID-19影像数据,该数据集支持了从图像分类到病变区域分割等多种任务的研究。此外,数据集还包含了其他病毒性和细菌性肺炎的影像,使得研究人员能够对比分析不同肺炎类型的影像特征,从而提升模型的泛化能力和诊断准确性。这一数据集为COVID-19的早期诊断和病情预测提供了重要的数据支持。
实际应用
在实际应用中,COVID-19图像数据集被广泛用于开发临床辅助诊断工具。例如,基于该数据集训练的AI模型可以在医院中作为第二意见系统,帮助医生快速筛查COVID-19患者,尤其是在医疗资源紧张的情况下。此外,该数据集还被用于研究COVID-19的病情严重程度预测,例如患者是否需要插管或补充氧气。这些应用不仅提高了诊断效率,还为患者的个性化治疗提供了数据支持,具有重要的临床意义。
数据集最近研究
最新研究方向
在COVID-19大流行的背景下,COVID-19图像数据集的开发和应用已成为医学影像分析领域的前沿研究方向。该数据集通过收集公开的胸部X光和CT图像,为研究人员提供了丰富的资源,用于开发基于人工智能的诊断和预后工具。当前的研究热点主要集中在利用深度学习技术对COVID-19肺炎的严重程度进行预测,以及区分不同类型的肺炎(如细菌性、病毒性和COVID-19肺炎)。这些研究不仅有助于提高诊断的准确性,还能为临床医生提供量化的评估工具,从而优化患者的治疗方案。此外,该数据集的开放性和多样性也为全球研究社区提供了合作和创新的平台,推动了医学影像分析技术的快速发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作