ChestX-Det10

github2024-05-01 更新2024-05-31 收录

下载链接：

https://github.com/Deepwise-AILab/ChestX-Det10-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

ChestX-Det10是从NIH ChestX-14中选取的3,543张图像的子集，由三位认证放射科医生标注了10种常见疾病或异常类别。这些类别包括肺不张、钙化、实变、胸腔积液、肺气肿、纤维化、骨折、肿块、结节、气胸。

ChestX-Det10 is a subset of 3,543 images selected from NIH ChestX-14, annotated by three certified radiologists for 10 common disease or abnormality categories. These categories include atelectasis, calcification, consolidation, pleural effusion, emphysema, fibrosis, fracture, mass, nodule, and pneumothorax.

创建时间：

2020-06-17

原始信息汇总

数据集概述

数据集名称

ChestX-Det10

数据来源

从NIH ChestX-14中选取的3,543张图像。

数据集内容

包含10种常见胸部疾病或异常的实例级标注，包括：Atelectasis, Calcification, Consolidation, Effusion, Emphysema, Fibrosis, Fracture, Mass, Nodule, Pneumothorax。

标注信息

标注文件：train.json 和 test.json
标注格式： json { "file_name": "xxx.png", "syms": [s1, s2, ...], "boxes": [[x1, y1, x2, y2], [x1, y1, x2, y2], …], }
syms：胸部异常或疾病的类别。
boxes：边界框的左上角和右下角坐标。

下载链接

训练数据：http://resource.deepwise.com/xraychallenge/train_data.zip
测试数据：http://resource.deepwise.com/xraychallenge/test_data.zip

评估方法

使用eval.py进行评估。
评估标准：使用固定每图像假阳性数的召回率（敏感性）作为主要标准。
正样本IOU阈值设置为0.5。
设置的假阳性率：0.05, 0.1, 0.2。
avgrecall：召回率@0.05fp, 召回率@0.1fp, 召回率@0.2fp的平均值。

引用信息

引用论文：https://arxiv.org/abs/2006.10550v3
引用格式： bibtex @misc{liu2020chestxdet10, title={ChestX-Det10: Chest X-ray Dataset on Detection of Thoracic Abnormalities}, author={Jingyu Liu and Jie Lian and Yizhou Yu}, year={2020}, eprint={2006.10550v3}, archivePrefix={arXiv}, primaryClass={eess.IV} }

搜集汇总

数据集介绍

构建方式

ChestX-Det10数据集是从NIH ChestX-14数据集中精选出的3,543张图像，并由三位经过认证的放射科医生进行标注。这些图像涵盖了10种常见的胸部疾病或异常，包括肺不张、钙化、实变、积液、肺气肿、纤维化、骨折、肿块、结节和气胸。标注过程严格遵循实例级别的边界框标注，确保了数据集的高质量和高准确性。

特点

ChestX-Det10数据集的显著特点在于其精细的实例级别标注和多样化的疾病类别。每张图像不仅标注了具体的疾病类别，还提供了精确的边界框坐标，这为胸部X光图像的疾病检测和定位提供了丰富的信息。此外，数据集的构建过程中邀请了多位专业放射科医生进行标注，确保了标注的权威性和可靠性。

使用方法

使用ChestX-Det10数据集时，用户可以通过提供的train.json和test.json文件获取图像及其对应的标注信息。每条标注记录包括图像文件名、疾病类别列表以及相应的边界框坐标。为了评估检测结果，用户可以使用提供的eval.py脚本，该脚本支持以固定每张图像的假阳性率来计算召回率，并提供了多种评估指标。

背景与挑战

背景概述

ChestX-Det10数据集是NIH ChestX-14数据集的一个子集，专注于胸部X光图像中10种常见疾病或异常的实例级边界框标注。该数据集由3,543张图像组成，并邀请了三位认证放射科医生进行标注，涵盖了诸如肺不张、钙化、实变、积液、肺气肿、纤维化、骨折、肿块、结节和气胸等类别。ChestX-Det10的创建旨在推动医学影像分析领域的发展，特别是胸部X光图像的自动检测与分类技术。其发布于2020年，由刘静宇、连杰和余一洲等研究人员主导，通过公开竞赛ChestX-Det10 Challenge进一步验证了其在实际应用中的潜力。

当前挑战

ChestX-Det10数据集在构建过程中面临多重挑战。首先，高质量的标注依赖于专业放射科医生的参与，确保了标注的准确性和可靠性，但也增加了数据集构建的时间和成本。其次，胸部X光图像中病灶的多样性和复杂性，使得自动检测算法在处理不同类别和不同形态的异常时面临困难。此外，数据集的评估标准采用固定每张图像的假阳性率下的召回率，这种评估方法在实际应用中具有较高的临床意义，但也对算法的性能提出了更高的要求。最后，数据集的公开竞赛ChestX-Det10 Challenge展示了其在推动技术进步方面的潜力，但也暴露了现有算法在处理复杂病例时的局限性。

常用场景

经典使用场景

在医学影像分析领域，ChestX-Det10数据集以其丰富的实例级标注和多类别的胸部疾病分类而著称。该数据集的经典使用场景主要集中在胸部X光片的自动诊断系统开发上。通过训练深度学习模型，研究人员能够实现对Atelectasis、Calcification、Consolidation等十种常见胸部异常的自动检测与定位。这种自动化的诊断流程不仅提高了诊断效率，还为医疗资源的合理分配提供了技术支持。

实际应用

在实际应用中，ChestX-Det10数据集为医疗机构提供了强大的辅助诊断工具。通过集成该数据集训练的模型，医院和诊所能够快速、准确地识别患者胸部X光片中的异常情况，从而辅助医生进行初步诊断。这种应用不仅提高了诊断的准确性和效率，还减轻了放射科医生的工作负担，使得医疗资源能够更有效地分配和利用。

衍生相关工作

基于ChestX-Det10数据集，许多相关研究工作得以展开。例如，研究人员利用该数据集开发了多种深度学习模型，用于胸部疾病的自动检测和分类。此外，该数据集还激发了关于医学影像数据标注和模型评估方法的研究，推动了医学影像分析领域的标准化和规范化。这些衍生工作不仅丰富了学术研究的内容，还为实际应用提供了坚实的技术基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集