SIXray

Name: SIXray
Creator: 中国科学院大学
Published: 2019-01-02 17:23:42
License: 暂无描述

arXiv2019-01-02 更新2024-06-21 收录

下载链接：

https://github.com/MeioJane/SIXray

下载链接

链接失效反馈

官方服务：

资源简介：

SIXray数据集是由中国科学院大学等机构创建的，包含超过100万张X射线图像，其中8929张图像标注了6类禁止物品。该数据集模拟了真实世界中安全检查的场景，其中禁止物品的出现频率非常低。数据集的创建旨在为研究提供一个基准，以解决X射线图像中物品重叠和复杂背景带来的挑战。SIXray数据集的应用领域主要集中在提高自动识别X射线图像中禁止物品的准确性和效率，以增强公共安全。

The SIXray dataset was developed by institutions including the University of Chinese Academy of Sciences. It contains more than 1 million X-ray images, among which 8929 images are annotated with 6 categories of prohibited items. This dataset simulates real-world security inspection scenarios, where the prevalence of prohibited items is extremely low. The dataset is designed to provide a benchmark for research aiming to tackle the challenges arising from overlapping objects and complex backgrounds in X-ray images. The primary application of the SIXray dataset focuses on improving the accuracy and efficiency of automatic recognition of prohibited items in X-ray images, thereby enhancing public safety.

提供机构：

中国科学院大学

创建时间：

2019-01-02

搜集汇总

数据集介绍

构建方式

在公共安全领域，X射线安检图像分析对于违禁品检测至关重要。SIXray数据集的构建基于真实场景下的安检需求，从多个地铁站收集了总计1,059,231张X射线图像。这些图像通过安检设备扫描生成，采用伪彩色编码以区分不同材质，并以JPEG格式存储，平均分辨率约为10万像素。数据集中包含六类违禁品，即枪支、刀具、扳手、钳子、剪刀和锤子，其中锤子类别因样本过少未在实验中采用。所有图像均附带由安检人员提供的图像级标注，指示每类违禁品是否存在；此外，在测试集上还手动添加了边界框标注，以支持对象定位评估。为模拟真实场景中正负样本的极端不平衡，数据集进一步划分为SIXray10、SIXray100和SIXray1000三个子集，分别对应负样本与正样本的比例为10:1、100:1和1000:1，每个子集按4:1的比例划分为训练集和测试集。

特点

SIXray数据集在安检视觉任务中展现出多重挑战性特征。其核心特点在于图像中物体的重叠性，由于X射线的穿透特性，行李中的物品随机堆叠，导致前景与背景对象在视觉上混合，形成复杂的重叠结构，这与自然图像中的遮挡现象存在本质差异。此外，数据集呈现出显著的类不平衡，正样本图像（包含至少一个违禁品）仅占不到1%，模拟了实际安检中违禁品出现频率极低的环境。违禁品在尺度、视角和子类型上存在广泛变异，增加了类内差异和识别难度。同时，图像背景常包含大量无关且难以标注的安全物品，引入了开放集噪声，使得算法需在复杂且无意义的上下文中进行精确检测。这些特性共同构成了一个大规模、高挑战性的基准，推动了重叠图像分析和不平衡学习的研究。

使用方法

SIXray数据集主要用于推动安检X射线图像中违禁品发现的研究，涵盖图像级分类和对象级定位任务。在图像分类方面，研究者可采用PascalVOC任务中的评估指标，即对每个类别单独计算平均精度（mAP），通过排序测试图像的置信度来评估模型性能。对于对象定位，可使用弱监督方法如类激活映射（CAM），通过特征图的最大响应点是否落入真实边界框内来计算定位准确率。数据集的三个子集允许研究不同正负样本比例下的算法鲁棒性，特别适合探索类不平衡处理技术。典型的使用流程包括：基于深度学习框架（如ResNet、Inception-v3或DenseNet）构建模型，利用训练集进行优化，并在测试集上评估分类与定位性能。数据集的边界框标注为弱监督定位提供了基准，而大规模样本支持了复杂模型（如类平衡分层细化方法）的训练与验证，有助于开发适用于真实安检场景的高效算法。

背景与挑战

背景概述

SIXray数据集于2019年由中国科学院大学、约翰斯·霍普金斯大学及金山软件的研究团队联合发布，旨在为安检X光图像中的违禁品检测提供大规模基准。该数据集包含超过一百万张X光图像，涵盖枪支、刀具等六类违禁品，其规模远超同类数据集如GDXray，并模拟了真实场景中极低阳性样本比例（约1%）的挑战。SIXray的构建推动了计算机视觉在公共安全领域的应用，特别是在复杂重叠图像与类别不平衡条件下的物体识别研究，为深度学习模型在安检自动化中的优化与评估奠定了重要基础。

当前挑战

SIXray数据集主要面临两大挑战：在领域问题层面，其核心任务是在重叠X光图像中实现违禁品的精准发现与定位，由于X射线的穿透特性，物体在图像中常呈现随机堆叠与透明重叠，导致传统基于自然图像设计的模型难以区分目标与背景噪声；在构建过程中，数据采集需应对真实安检场景中违禁品出现频率极低的问题，使得阳性样本稀缺，同时人工标注需处理图像中物体尺度、视角及类内差异的巨大变化，并克服复杂背景与无意义上下文的干扰，这些因素共同加剧了数据集的构建难度与模型训练的稳定性挑战。

常用场景

经典使用场景

在公共安全领域，X射线安检图像分析是保障交通枢纽与公共场所安全的关键技术。SIXray数据集作为大规模重叠X射线图像基准，其经典使用场景聚焦于复杂背景下的违禁物品自动识别。该数据集模拟真实安检环境，其中物品随机堆叠且高度重叠，为深度学习模型提供了训练与评估平台，尤其适用于研究重叠图像中多类别违禁物品的检测与分类任务。

衍生相关工作

围绕SIXray数据集，学术界衍生出一系列经典研究工作。其中，类别平衡层次细化（CHR）方法通过反向连接融合多层次视觉线索，成为处理重叠与不平衡数据的基准框架。后续研究进一步探索了基于穿透假设的物理模型改进、弱监督定位算法的优化，以及将重叠图像分析技术迁移至自然图像处理等领域，持续拓展了计算机视觉在安检场景中的应用边界。

数据集最近研究