ChestX-Det10
收藏github2024-05-01 更新2024-05-31 收录
下载链接:
https://github.com/Deepwise-AILab/ChestX-Det10-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
ChestX-Det10是从NIH ChestX-14中选取的3,543张图像的子集,由三位认证放射科医生标注了10种常见疾病或异常类别。这些类别包括肺不张、钙化、实变、胸腔积液、肺气肿、纤维化、骨折、肿块、结节、气胸。
ChestX-Det10 is a subset of 3,543 images selected from NIH ChestX-14, annotated by three certified radiologists for 10 common disease or abnormality categories. These categories include atelectasis, calcification, consolidation, pleural effusion, emphysema, fibrosis, fracture, mass, nodule, and pneumothorax.
创建时间:
2020-06-17
原始信息汇总
数据集概述
数据集名称
- ChestX-Det10
数据来源
- 从NIH ChestX-14中选取的3,543张图像。
数据集内容
- 包含10种常见胸部疾病或异常的实例级标注,包括:Atelectasis, Calcification, Consolidation, Effusion, Emphysema, Fibrosis, Fracture, Mass, Nodule, Pneumothorax。
标注信息
-
标注文件:
train.json和test.json -
标注格式: json { "file_name": "xxx.png", "syms": [s1, s2, ...], "boxes": [[x1, y1, x2, y2], [x1, y1, x2, y2], …], }
-
syms:胸部异常或疾病的类别。 -
boxes:边界框的左上角和右下角坐标。
下载链接
- 训练数据:http://resource.deepwise.com/xraychallenge/train_data.zip
- 测试数据:http://resource.deepwise.com/xraychallenge/test_data.zip
评估方法
- 使用
eval.py进行评估。 - 评估标准:使用固定每图像假阳性数的召回率(敏感性)作为主要标准。
- 正样本IOU阈值设置为0.5。
- 设置的假阳性率:0.05, 0.1, 0.2。
avgrecall:召回率@0.05fp, 召回率@0.1fp, 召回率@0.2fp的平均值。
引用信息
- 引用论文:https://arxiv.org/abs/2006.10550v3
- 引用格式: bibtex @misc{liu2020chestxdet10, title={ChestX-Det10: Chest X-ray Dataset on Detection of Thoracic Abnormalities}, author={Jingyu Liu and Jie Lian and Yizhou Yu}, year={2020}, eprint={2006.10550v3}, archivePrefix={arXiv}, primaryClass={eess.IV} }
搜集汇总
数据集介绍

构建方式
ChestX-Det10数据集是从NIH ChestX-14数据集中精选出的3,543张图像,并由三位经过认证的放射科医生进行标注。这些图像涵盖了10种常见的胸部疾病或异常,包括肺不张、钙化、实变、积液、肺气肿、纤维化、骨折、肿块、结节和气胸。标注过程严格遵循实例级别的边界框标注,确保了数据集的高质量和高准确性。
特点
ChestX-Det10数据集的显著特点在于其精细的实例级别标注和多样化的疾病类别。每张图像不仅标注了具体的疾病类别,还提供了精确的边界框坐标,这为胸部X光图像的疾病检测和定位提供了丰富的信息。此外,数据集的构建过程中邀请了多位专业放射科医生进行标注,确保了标注的权威性和可靠性。
使用方法
使用ChestX-Det10数据集时,用户可以通过提供的train.json和test.json文件获取图像及其对应的标注信息。每条标注记录包括图像文件名、疾病类别列表以及相应的边界框坐标。为了评估检测结果,用户可以使用提供的eval.py脚本,该脚本支持以固定每张图像的假阳性率来计算召回率,并提供了多种评估指标。
背景与挑战
背景概述
ChestX-Det10数据集是NIH ChestX-14数据集的一个子集,专注于胸部X光图像中10种常见疾病或异常的实例级边界框标注。该数据集由3,543张图像组成,并邀请了三位认证放射科医生进行标注,涵盖了诸如肺不张、钙化、实变、积液、肺气肿、纤维化、骨折、肿块、结节和气胸等类别。ChestX-Det10的创建旨在推动医学影像分析领域的发展,特别是胸部X光图像的自动检测与分类技术。其发布于2020年,由刘静宇、连杰和余一洲等研究人员主导,通过公开竞赛ChestX-Det10 Challenge进一步验证了其在实际应用中的潜力。
当前挑战
ChestX-Det10数据集在构建过程中面临多重挑战。首先,高质量的标注依赖于专业放射科医生的参与,确保了标注的准确性和可靠性,但也增加了数据集构建的时间和成本。其次,胸部X光图像中病灶的多样性和复杂性,使得自动检测算法在处理不同类别和不同形态的异常时面临困难。此外,数据集的评估标准采用固定每张图像的假阳性率下的召回率,这种评估方法在实际应用中具有较高的临床意义,但也对算法的性能提出了更高的要求。最后,数据集的公开竞赛ChestX-Det10 Challenge展示了其在推动技术进步方面的潜力,但也暴露了现有算法在处理复杂病例时的局限性。
常用场景
经典使用场景
在医学影像分析领域,ChestX-Det10数据集以其丰富的实例级标注和多类别的胸部疾病分类而著称。该数据集的经典使用场景主要集中在胸部X光片的自动诊断系统开发上。通过训练深度学习模型,研究人员能够实现对Atelectasis、Calcification、Consolidation等十种常见胸部异常的自动检测与定位。这种自动化的诊断流程不仅提高了诊断效率,还为医疗资源的合理分配提供了技术支持。
实际应用
在实际应用中,ChestX-Det10数据集为医疗机构提供了强大的辅助诊断工具。通过集成该数据集训练的模型,医院和诊所能够快速、准确地识别患者胸部X光片中的异常情况,从而辅助医生进行初步诊断。这种应用不仅提高了诊断的准确性和效率,还减轻了放射科医生的工作负担,使得医疗资源能够更有效地分配和利用。
衍生相关工作
基于ChestX-Det10数据集,许多相关研究工作得以展开。例如,研究人员利用该数据集开发了多种深度学习模型,用于胸部疾病的自动检测和分类。此外,该数据集还激发了关于医学影像数据标注和模型评估方法的研究,推动了医学影像分析领域的标准化和规范化。这些衍生工作不仅丰富了学术研究的内容,还为实际应用提供了坚实的技术基础。
以上内容由遇见数据集搜集并总结生成



