five

SIXray

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/meiojane/sixray
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为SIXray,包含双能X射线图像,共分为六类,其中包括禁止携带的物品。具体来说,这是一个包含五类物品(枪、刀、扳手、钳子、剪刀)的子集,总计8,929张图像,这些图像是在地铁站收集的。这些图像对应于日常流通中的普通物品,并用于评估卷积神经网络模型的表现。该数据集的规模为8,929张图像,任务是对禁止携带的物品进行检测。

The dataset named SIXray consists of dual-energy X-ray images, which are divided into six categories including prohibited carry-on items. Specifically, it contains a subset of five types of prohibited items (guns, knives, wrenches, pliers, scissors) with a total of 8,929 images. These images were collected at subway stations, depicting common daily-use items, and are used to evaluate the performance of convolutional neural network models. With a total of 8,929 images, the core task of this dataset is to detect prohibited carry-on items.
搜集汇总
数据集介绍
main_image_url
构建方式
在公共安全领域,X射线安检图像分析对于违禁品检测至关重要。SIXray数据集的构建基于真实场景下的安检需求,从多个地铁站收集了总计1,059,231张X射线图像,这些图像通过安检设备扫描生成,并采用伪彩色编码以区分不同材质的物体。数据集中包含六类常见违禁品,即枪支、刀具、扳手、钳子、剪刀和锤子,其中锤子类别因样本过少未在实验中采用。所有图像均以JPEG格式存储,平均分辨率约为10万像素。为确保数据集的实用性,研究团队依据正负样本比例构建了三个子集:SIXray10、SIXray100和SIXray1000,以模拟不同失衡程度的训练环境。正样本图像共计8,929张,由人工安检员进行图像级标注,确认每类违禁品的存在与否;测试集则进一步提供了边界框级别的精细标注,以支持物体定位任务的评估。
特点
SIXray数据集展现出若干显著特性,为视觉识别任务带来独特挑战。其核心特征在于图像的重叠性,由于X射线的穿透特性,行李中随机堆叠的物品在图像中均可见,形成复杂的重叠结构,这与自然图像中的遮挡现象截然不同。此外,违禁品在尺度、视角、样式及子类型上呈现高度多样性,导致类内差异显著,增加了识别难度。背景区域常包含大量无关物品,这些物品构成开放集噪声,使得背景内容难以预测。数据分布呈现严重失衡,正样本仅占不足1%,这种极端失衡易使训练过程偏向负类,影响模型稳定性。这些特性共同塑造了SIXray在安检X射线图像分析领域的基准价值。
使用方法
SIXray数据集主要用于违禁品发现任务,支持图像级分类与物体级定位研究。在图像分类任务中,可采用PascalVOC的评价指标,即计算每个类别的平均精度(mAP)。对于物体定位,可利用测试集提供的边界框标注,通过类激活映射(CAM)等弱监督方法生成热图,并评估最大响应点是否落入真实边界框内,以计算定位准确率。为应对数据失衡,研究者可借鉴论文提出的类别平衡分层细化(CHR)方法,该方法通过反向连接将高层语义信息引导至中层特征,并设计类别平衡损失函数以缓解负样本主导的问题。数据集的三个子集允许在不同正负样本比例下验证算法鲁棒性,训练集与测试集按4:1比例划分,确保评估的可靠性。
背景与挑战
背景概述
SIXray数据集作为大规模安检X射线图像基准,由中国科学院大学与约翰霍普金斯大学等机构于2019年联合创建,旨在推动重叠图像中违禁物品发现的研究。该数据集包含超过一百万张X射线图像,涵盖枪支、刀具等六类违禁物品的标注,其规模远超同期公开数据集GDXray百倍以上。核心研究问题聚焦于复杂背景与高度重叠场景下的物品识别,模拟了真实安检环境中低频率违禁物品出现的挑战,为计算机视觉在公共安全领域的应用提供了关键数据支撑,显著提升了该领域算法研究的可行性与实用性。
当前挑战
SIXray数据集所解决的领域问题在于安检X射线图像中违禁物品的发现与定位,其挑战主要源于图像中物体的高度重叠性、类内差异显著以及背景杂乱无意义。具体而言,X射线的穿透特性使得多层物品在图像中同时可见,导致传统视觉模型难以区分目标与干扰;同时,违禁物品在尺度、视角和子类型上呈现巨大变化,加剧了识别难度。构建过程中的挑战则体现在数据的高度不平衡性,正样本比例不足1%,易使训练过程偏向负类;此外,手动标注海量图像中的违禁物品需克服重叠区域辨析与背景噪声干扰,增加了标注的一致性与准确性保障难度。
常用场景
经典使用场景
在公共安全领域,X射线安检图像分析是保障交通枢纽与公共场所安全的关键技术。SIXray数据集作为大规模重叠X射线图像基准,其经典应用场景聚焦于复杂背景下的违禁物品自动识别。该数据集通过模拟真实安检环境中物品随机堆叠与重叠的物理特性,为算法提供了涵盖枪支、刀具、扳手等六类违禁物品的百万级图像样本,有效支撑了重叠物体检测与分类模型的训练与评估。
实际应用
在实际安检系统中,SIXray数据集为自动化违禁物品检测技术的落地提供了关键数据支撑。基于该数据集训练的模型已应用于地铁站、机场等交通枢纽的X射线行李扫描仪,能够实时识别行李中隐蔽的枪支、刀具等危险物品。其处理重叠物体的能力有效降低了人工巡检的漏检率,提升了安检效率与准确性,为公共安全防控提供了可靠的技术保障。
衍生相关工作
SIXray数据集的发布催生了多项围绕重叠X射线图像分析的经典研究工作。基于该数据集提出的类别平衡层次化优化方法为后续的弱监督物体定位算法提供了新思路。此外,该数据集启发了对穿透性物理模型的深入探索,推动了多尺度特征融合、注意力机制在安检图像中的创新应用。相关成果进一步拓展至自然图像中的遮挡物体检测领域,促进了跨域视觉理解方法的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作