ChestX-Det10

github2024-12-05 更新2024-12-06 收录

下载链接：

https://github.com/yasirusama61/YOLOv8-Object-Detection

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含3,543张胸部X光图像，标注了10种胸部异常的边界框，包括结节、肿块和气胸。该项目使用ChestX-Det10数据集，它是NIH ChestX-14的一个子集。

This dataset contains 3,543 chest X-ray images, with bounding boxes annotated for 10 types of thoracic abnormalities including nodules, masses, and pneumothorax. This project utilizes the ChestX-Det10 dataset, which is a subset of the NIH ChestX-14 dataset.

创建时间：

2024-11-27

原始信息汇总

数据集概述

数据集信息

数据集名称: ChestX-Det10
数据来源: 该数据集是NIH ChestX-14数据集的一个子集。
数据类型: 胸部X光图像
图像数量:
- 训练图像: 3,001
- 测试图像: 1,000+
类别数量: 10
类别列表:
- Consolidation
- Pneumothorax
- Emphysema
- Calcification
- Nodule
- Mass
- Fracture
- Effusion
- Atelectasis
- Fibrosis
数据缺失: 22.69%的数据被视为背景。

数据集特点

类别分布: 数据集存在类别不平衡问题，其中Consolidation和Effusion是最常见的类别，而Mass和Pneumothorax则较为稀少。
边界框分布: 大多数边界框较小，宽度与高度主要集中在200像素以下，面积分布偏向较小的区域。

数据处理

数据增强: 应用了随机水平翻转、随机旋转、颜色抖动和归一化等增强技术。
类别权重调整: 通过加权损失函数来处理类别不平衡问题。
注意力机制: 引入了CBAM（卷积块注意力模块）以提高特征选择能力。

数据集用途

目标检测: 用于训练和评估YOLOv8和Faster R-CNN模型，以检测胸部X光图像中的异常情况。
模型比较: 分析YOLOv8和Faster R-CNN在速度、准确性和精度方面的表现。
性能优化: 通过类别权重调整、数据增强和学习率调整等技术优化模型性能。

数据集引用

ChestX-ray14 Dataset: arXiv:1705.02315
CheXNet: arXiv:1711.05225

搜集汇总

数据集介绍

构建方式

ChestX-Det10数据集的构建基于NIH ChestX-14数据集，精选了3,543张胸部X光图像，并对其进行了详细的标注。这些图像涵盖了10种胸腔异常，包括结节、肿块和气胸等。数据集的构建过程中，采用了边界框标注技术，确保每种异常都能被精确地定位。此外，数据集还处理了22.69%的缺失数据，将其视为背景，以增强模型的鲁棒性。

特点

ChestX-Det10数据集的主要特点在于其高度的专业性和复杂性。首先，数据集包含了多种胸腔异常的详细标注，为模型训练提供了丰富的信息。其次，数据集中的类别分布不均衡，这为模型训练带来了挑战，但也为研究者提供了优化模型性能的机会。此外，数据集中的边界框分布分析揭示了小对象检测的普遍性，这要求模型具备处理小尺寸异常的能力。

使用方法

使用ChestX-Det10数据集时，首先需要将数据集转换为YOLO兼容的格式，并处理缺失数据。随后，可以选择YOLOv8或Faster R-CNN等先进的对象检测架构进行模型训练。在训练过程中，建议采用数据增强技术，如随机水平翻转和颜色抖动，以提高模型的泛化能力。最后，通过评估模型的精度、召回率和mAP等指标，可以全面了解模型在胸腔异常检测任务中的表现。

背景与挑战

背景概述

胸腔异常检测在医学诊断中占据重要地位，ChestX-Det10数据集应运而生，旨在通过先进的对象检测架构识别胸部X光片中的胸腔异常。该数据集由3,543张胸部X光图像组成，标注了10种胸腔异常，包括结节、肿块和气胸等。ChestX-Det10数据集是NIH ChestX-14数据集的子集，由主要研究人员和机构开发，旨在通过训练和评估模型，比较YOLOv8和Faster R-CNN在速度、准确性和精度方面的表现，从而优化其在实际医疗诊断中的性能。

当前挑战

ChestX-Det10数据集面临的主要挑战包括数据集中的类别不平衡问题，其中某些异常类别如结节和气胸的样本较少，这可能导致模型在检测这些少数类别时表现不佳。此外，构建过程中遇到的挑战还包括处理缺失数据，约22.69%的图像被视为背景，以及在模型设计中有效处理小对象检测问题。这些挑战要求在预处理和模型设计阶段采用如过采样、数据增强和加权随机采样等技术，以提高模型对少数类别和小异常的检测能力。

常用场景

经典使用场景

在医学影像分析领域，ChestX-Det10数据集被广泛用于胸部X光片中胸腔异常的检测。该数据集包含3,543张胸部X光图像，标注了10种胸腔异常，如结节、肿块和气胸。经典的使用场景包括训练和评估YOLOv8和Faster R-CNN等先进的物体检测模型，以实现对胸部X光片中异常的高效检测和定位。

衍生相关工作

基于ChestX-Det10数据集，衍生了许多相关的经典工作，包括对YOLOv8和Faster R-CNN等模型的优化和比较研究。这些工作不仅提升了模型在胸腔异常检测中的性能，还探索了如类权重调整、数据增强和注意力机制等技术在医学影像分析中的应用。此外，该数据集还促进了多尺度特征提取和处理小目标检测的研究，为医学影像分析领域提供了新的思路和方法。

数据集最近研究