HRCTCov19
收藏arXiv2023-12-05 更新2024-06-21 收录
下载链接:
http://databiox.com
下载链接
链接失效反馈官方服务:
资源简介:
HRCTCov19是由伊斯法罕医科大学创建的高分辨率胸部CT扫描图像数据集,专门用于COVID-19的诊断和区分。该数据集包含181,106张来自395名患者的图像,分为GGO、Crazy Paving、Air Space Consolidation和Negative四个类别。数据集的创建过程涉及从2021年2月至9月在Milad医院的急诊室收集的患者数据,所有CT检查均使用128排多探测器CT系统进行。该数据集主要用于支持基于人工智能的COVID-19诊断算法的研究,尤其是通过机器学习和深度学习方法。
HRCTCov19 is a high-resolution chest CT scan image dataset developed by Isfahan University of Medical Sciences, specifically designed for COVID-19 diagnosis and differential diagnosis. This dataset contains 181,106 images from 395 patients, divided into four categories: Ground-Glass Opacity (GGO), Crazy Paving, Air Space Consolidation, and Negative. The dataset was constructed using patient data collected from the emergency department of Milad Hospital between February and September 2021, and all CT examinations were performed with a 128-slice multi-detector CT system. This dataset is primarily intended to support research on AI-based COVID-19 diagnostic algorithms, particularly via machine learning and deep learning approaches.
提供机构:
伊斯法罕医科大学
创建时间:
2022-05-06
搜集汇总
数据集介绍

构建方式
在医学影像领域,高分辨率CT(HRCT)为COVID-19肺炎的诊断与鉴别提供了关键视觉依据。HRCTCov19数据集的构建遵循严谨的临床采集流程,其数据源自2021年2月至9月期间米拉德医院急诊科收治的疑似COVID-19肺炎患者。所有影像均采用128排多层螺旋CT系统(西门子SOMATOM Definition Flash)采集,扫描范围覆盖胸廓入口至肋膈角下缘,并统一采用100KV管电压、100-200mA管电流及0.6毫米探测器准直等标准化协议。每位患者的CT图像均经由经验丰富的放射科医师独立审阅,并依据肺部窗口(窗宽1000HU,窗位-700HU)进行预处理,同时结合RT-PCR检测结果对COVID-19诊断进行最终确认。数据集最终整合了395名患者的181,106幅灰度HRCT图像,并依据影像学特征划分为毛玻璃样变、铺路石征、空气空间实变及阴性四类标签。
特点
该数据集的核心特点在于其高分辨率与精细的病理标注体系。相较于常规CT影像,HRCTCov19提供的1毫米层厚切片能清晰呈现肺部细微结构变化,为识别早期及不典型COVID-19征象创造了条件。数据集不仅涵盖COVID-19典型的毛玻璃样变、铺路石征和实变等多类影像学表现,还纳入了RT-PCR检测阴性的对照病例,形成了具有鉴别诊断价值的四分类体系。其数据规模达到18万余幅图像,覆盖了从青年至老年各年龄段的患者群体,且同时提供切片级与患者级双重标注,既支持病灶区域的局部分析,也满足患者级别的整体评估需求。这种结构设计显著提升了其在人工智能算法训练与验证中的实用性与泛化能力。
使用方法
该数据集主要服务于基于人工智能的COVID-19辅助诊断与鉴别研究。研究者可通过Zenodo数据仓库或DataBioX网站公开获取数据集,其图像以灰度格式存储,并附有详细的Excel格式元数据文件。在使用时,可依据切片级标签进行病灶分割、特征提取等计算机视觉任务,或基于患者级标签构建端到端的分类与预测模型。鉴于数据集中不同类别样本量存在差异,建议采用分层抽样、数据增强或迁移学习策略以优化模型训练效果。该数据集亦适用于多中心研究的交叉验证,或作为预训练模型的微调基准,推动高精度、可解释的医学影像算法在呼吸系统疾病诊断中的实际应用。
背景与挑战
背景概述
在COVID-19全球大流行的背景下,高分辨率计算机断层扫描(HRCT)成为诊断与监测新冠肺炎肺炎的关键影像学工具。由伊朗伊斯法罕医科大学、伊斯法罕理工大学及阿拉克医科大学的研究团队于2023年共同创建的HRCTCov19数据集,旨在应对公开COVID-19胸部CT影像数据稀缺的困境。该数据集收录了来自395名患者的181,106张高分辨率胸部CT图像,涵盖毛玻璃样变、铺路石征、空气空间实变及阴性病例四类标签,不仅为基于人工智能的COVID-19诊断与鉴别算法开发提供了宝贵资源,更通过其精细的切片级与患者级标注,推动了医学影像分析领域在疫情应对中的科研进展与应用深化。
当前挑战
HRCTCov19数据集致力于解决COVID-19肺炎的影像学诊断与鉴别挑战,其核心在于通过高分辨率CT图像精准区分新冠肺炎的典型表现(如毛玻璃样变)与其他肺部病变,提升AI模型在复杂影像特征中的分类鲁棒性与泛化能力。在构建过程中,研究团队面临数据收集的多重障碍:患者隐私保护限制了公开数据的获取,导致早期可用数据集规模有限;影像质量易受呼吸伪影等因素干扰,部分类别样本数量不均,如铺路石征与空气空间实变病例较少,可能影响模型训练的平衡性;此外,跨机构数据整合需统一成像协议与标注标准,以保障数据的一致性与可靠性。
常用场景
经典使用场景
在医学影像分析领域,HRCTCov19数据集为COVID-19的智能诊断提供了关键支撑。该数据集凭借其高分辨率胸部CT图像,成为训练和验证深度学习模型的核心资源,广泛应用于肺炎类型的自动识别与分类。研究者通过卷积神经网络等算法,能够精准区分毛玻璃样变、铺路石征、空气空间实变及阴性病例,从而辅助放射科医生进行高效、准确的影像解读。
衍生相关工作
基于HRCTCov19数据集,学术界衍生出一系列经典研究工作。例如,研究者利用该数据集开发了多标签分类网络,实现了COVID-19不同肺部表现的细粒度识别;另有工作结合迁移学习策略,将预训练模型适配于小样本医疗影像分析。这些研究不仅提升了肺炎自动诊断的准确率,还推动了如COVID-CT-MD、Mosmeddata等相关数据集的构建与benchmark比较,形成了良性学术生态。
数据集最近研究
最新研究方向
在医学影像分析领域,高分辨率胸部CT数据集HRCTCov19的推出,为COVID-19的智能诊断研究注入了新的活力。该数据集不仅涵盖了磨玻璃影、铺路石征、空气空间实变及阴性病例等多类标签,还提供了切片级与患者级注释,极大地促进了基于深度学习算法的肺炎病变精准识别与鉴别诊断研究。当前,前沿探索聚焦于利用该数据集训练多任务学习模型,以同时实现病变分割、严重程度评估及预后预测,并探索跨模态融合策略,结合临床数据提升诊断系统的鲁棒性与泛化能力。这一进展对于推动个性化医疗及公共卫生应急响应具有深远意义,为全球抗疫科研提供了宝贵的数据资源。
相关研究论文
- 1HRCTCov19 -- A High-Resolution Chest CT Scan Image Dataset for COVID-19 Diagnosis and Differentiation伊斯法罕医科大学 · 2023年
以上内容由遇见数据集搜集并总结生成



