COVIDx CXR-3
收藏arXiv2022-11-19 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2206.03671v3
下载链接
链接失效反馈官方服务:
资源简介:
COVIDx CXR-3是由滑铁卢大学视觉与图像处理实验室创建的大型开放源代码基准数据集,包含30,386张来自17,026名患者的胸部X光图像,覆盖至少51个国家,旨在支持COVID-19计算机视觉研究。该数据集通过与专家放射科医生和临床医生的合作,精心筛选,包括不同年龄、性别和影像视图的多样性,以减少偏见和数据集不平衡。COVIDx CXR-3的应用领域主要集中在通过深度学习驱动的计算机辅助诊断,以检测和评估COVID-19病例的严重性,从而在疫情期间提供有效的筛查和患者分流策略。
COVIDx CXR-3 is a large open-source benchmark dataset created by the Vision and Image Processing Lab at the University of Waterloo. It encompasses 30,386 chest X-ray images from 17,026 patients across at least 51 countries, with the goal of supporting computer vision research focused on COVID-19. This dataset was carefully curated through collaboration with expert radiologists and clinicians, incorporating diversity in age, gender and radiographic views to reduce bias and address dataset imbalance. The primary applications of COVIDx CXR-3 center on deep learning-driven computer-aided diagnosis for detecting COVID-19 cases and evaluating their severity, thereby providing effective screening and patient triage strategies during the COVID-19 pandemic.
提供机构:
滑铁卢大学
创建时间:
2022-06-08
搜集汇总
数据集介绍

构建方式
COVIDx CXR-3数据集的构建过程采用了精心策划和专家审核的方式,以确保数据集的质量和适用性。数据集由来自多机构、多国家的患者队列组成,包括来自至少51个国家的17,026名患者的30,386张胸部X光图像。这些图像从多个来源收集,包括RSNA国际COVID-19开放放射学数据库、纽约石溪大学、瓦伦西亚地区医学影像库等。专家反馈用于评估每个来源图像的质量和适用性,导致从列出的来源中删除了一些图像。此外,还创建了一个没有与训练集患者重叠的测试集,以进行更准确的模型评估。
特点
COVIDx CXR-3数据集具有以下几个显著特点:1)规模庞大:包含来自至少51个国家的30,386张胸部X光图像,是目前公开可获取的最大的COVID-19胸部X光图像数据集;2)多样性:涵盖了不同感染类型的病例,包括正常、非SARS-CoV-2肺炎和SARS-CoV-2阳性病例,以及不同的患者人口统计学特征和成像视角;3)高质量:图像和注释均经过专家审核,确保了数据集的质量和可靠性。
使用方法
COVIDx CXR-3数据集可用于多种目的,包括COVID-19的计算机辅助诊断、病情严重程度评估和患者分流等。研究人员可以利用该数据集训练和评估深度学习模型,以提高COVID-19诊断的准确性和泛化能力。此外,该数据集还可以用于开发新的机器学习算法和模型,以应对COVID-19大流行和相关疾病。
背景与挑战
背景概述
COVID-19疫情自爆发以来,对全球造成了持续性的压力。胸部X射线(CXR)成像作为一种辅助筛查策略,在临床上的应用日益广泛,尤其是在呼吸道疾病患者中。基于CXR成像的视觉感知模型在COVID-19筛查中得到了广泛的研究。然而,这些模型的准确性和泛化能力很大程度上取决于所训练数据集的多样性和规模。为了应对这一挑战,研究人员提出了COVIDx CXR-3,这是一个大规模的CXR图像基准数据集,旨在支持COVID-19计算机视觉研究。COVIDx CXR-3包含了来自至少51个国家的17,026名患者的30,386张CXR图像,据我们所知,这是目前最广泛、最多样化的COVID-19 CXR开放数据集。该数据集为科学家提供了全面的详细信息,包括患者人口统计学、成像视图和感染类型,以期在COVID-19大流行和相关疾病的机器学习研究中取得进展。
当前挑战
尽管COVIDx CXR-3数据集提供了大量的CXR图像,但仍存在一些挑战。首先,数据集的构建过程中可能会遇到数据质量问题,如图像分辨率不一致、标签错误等。其次,数据集的多样性可能会导致模型在特定人群或特定感染类型上的泛化能力不足。此外,数据集的开放性也可能导致数据被滥用,例如保险公司可能利用数据构建预测模型,导致不合理的保险费率。最后,随着COVID-19病毒的不断变异,现有的数据集可能无法完全反映新型变异株的影像特征,这对模型的泛化能力提出了更高的要求。
常用场景
经典使用场景
COVIDx CXR-3数据集主要用于计算机辅助的COVID-19诊断研究。该数据集提供了30,386张胸部X光图像,来自至少51个国家的17,026名患者,是目前已知的最全面、最多样化的COVID-19胸部X光图像开放数据集。研究人员可以使用该数据集来训练和测试深度学习模型,以检测COVID-19病例,并评估疾病的严重程度,从而帮助临床医生进行诊断和患者分流。
衍生相关工作
COVIDx CXR-3数据集的发布促进了计算机辅助COVID-19诊断研究的发展,并衍生出一系列相关工作。例如,COVID-Net、COVID-Net CXR-2和MEDUSA等深度神经网络架构被提出,以利用该数据集进行COVID-19病例的检测和严重程度评估。此外,该数据集还被用于研究COVID-19诊断中的潜在偏差和局限性,以及开发新的图像处理和数据分析技术。
数据集最近研究
最新研究方向
COVIDx CXR-3数据集作为一项重要的开放资源,为COVID-19的计算机视觉研究提供了强大的支持。该数据集不仅包含大量胸部X光片,而且跨越了至少51个国家,使得数据集具有极高的多样性和广泛性。研究者们可以利用COVIDx CXR-3数据集进行COVID-19的早期诊断、病情严重程度评估以及相关疾病的计算机辅助诊断。此外,该数据集的发布也旨在鼓励研究人员、临床科学家和公民数据科学家加快对抗疫情的研究进展,推动相关疾病的创新治疗方法的开发。
相关研究论文
- 1COVIDx CXR-3: A Large-Scale, Open-Source Benchmark Dataset of Chest X-ray Images for Computer-Aided COVID-19 Diagnostics滑铁卢大学 · 2022年
以上内容由遇见数据集搜集并总结生成



