five

SIXray

收藏
arXiv2019-01-02 更新2024-06-21 收录
下载链接:
https://github.com/MeioJane/SIXray
下载链接
链接失效反馈
官方服务:
资源简介:
SIXray数据集是由中国科学院大学等机构创建的,包含超过100万张X射线图像,其中8929张图像标注了6类禁止物品。该数据集模拟了真实世界中安全检查的场景,其中禁止物品的出现频率非常低。数据集的创建旨在为研究提供一个基准,以解决X射线图像中物品重叠和复杂背景带来的挑战。SIXray数据集的应用领域主要集中在提高自动识别X射线图像中禁止物品的准确性和效率,以增强公共安全。

The SIXray dataset was developed by institutions including the University of Chinese Academy of Sciences. It contains more than 1 million X-ray images, among which 8929 images are annotated with 6 categories of prohibited items. This dataset simulates real-world security inspection scenarios, where the prevalence of prohibited items is extremely low. The dataset is designed to provide a benchmark for research aiming to tackle the challenges arising from overlapping objects and complex backgrounds in X-ray images. The primary application of the SIXray dataset focuses on improving the accuracy and efficiency of automatic recognition of prohibited items in X-ray images, thereby enhancing public safety.
提供机构:
中国科学院大学
创建时间:
2019-01-02
搜集汇总
数据集介绍
main_image_url
构建方式
在公共安全领域,X射线安检图像分析对于违禁品检测至关重要。SIXray数据集的构建基于真实场景下的安检需求,从多个地铁站收集了总计1,059,231张X射线图像。这些图像通过安检设备扫描生成,采用伪彩色编码以区分不同材质,并以JPEG格式存储,平均分辨率约为10万像素。数据集中包含六类违禁品,即枪支、刀具、扳手、钳子、剪刀和锤子,其中锤子类别因样本过少未在实验中采用。所有图像均附带由安检人员提供的图像级标注,指示每类违禁品是否存在;此外,在测试集上还手动添加了边界框标注,以支持对象定位评估。为模拟真实场景中正负样本的极端不平衡,数据集进一步划分为SIXray10、SIXray100和SIXray1000三个子集,分别对应负样本与正样本的比例为10:1、100:1和1000:1,每个子集按4:1的比例划分为训练集和测试集。
特点
SIXray数据集在安检视觉任务中展现出多重挑战性特征。其核心特点在于图像中物体的重叠性,由于X射线的穿透特性,行李中的物品随机堆叠,导致前景与背景对象在视觉上混合,形成复杂的重叠结构,这与自然图像中的遮挡现象存在本质差异。此外,数据集呈现出显著的类不平衡,正样本图像(包含至少一个违禁品)仅占不到1%,模拟了实际安检中违禁品出现频率极低的环境。违禁品在尺度、视角和子类型上存在广泛变异,增加了类内差异和识别难度。同时,图像背景常包含大量无关且难以标注的安全物品,引入了开放集噪声,使得算法需在复杂且无意义的上下文中进行精确检测。这些特性共同构成了一个大规模、高挑战性的基准,推动了重叠图像分析和不平衡学习的研究。
使用方法
SIXray数据集主要用于推动安检X射线图像中违禁品发现的研究,涵盖图像级分类和对象级定位任务。在图像分类方面,研究者可采用PascalVOC任务中的评估指标,即对每个类别单独计算平均精度(mAP),通过排序测试图像的置信度来评估模型性能。对于对象定位,可使用弱监督方法如类激活映射(CAM),通过特征图的最大响应点是否落入真实边界框内来计算定位准确率。数据集的三个子集允许研究不同正负样本比例下的算法鲁棒性,特别适合探索类不平衡处理技术。典型的使用流程包括:基于深度学习框架(如ResNet、Inception-v3或DenseNet)构建模型,利用训练集进行优化,并在测试集上评估分类与定位性能。数据集的边界框标注为弱监督定位提供了基准,而大规模样本支持了复杂模型(如类平衡分层细化方法)的训练与验证,有助于开发适用于真实安检场景的高效算法。
背景与挑战
背景概述
SIXray数据集于2019年由中国科学院大学、约翰斯·霍普金斯大学及金山软件的研究团队联合发布,旨在为安检X光图像中的违禁品检测提供大规模基准。该数据集包含超过一百万张X光图像,涵盖枪支、刀具等六类违禁品,其规模远超同类数据集如GDXray,并模拟了真实场景中极低阳性样本比例(约1%)的挑战。SIXray的构建推动了计算机视觉在公共安全领域的应用,特别是在复杂重叠图像与类别不平衡条件下的物体识别研究,为深度学习模型在安检自动化中的优化与评估奠定了重要基础。
当前挑战
SIXray数据集主要面临两大挑战:在领域问题层面,其核心任务是在重叠X光图像中实现违禁品的精准发现与定位,由于X射线的穿透特性,物体在图像中常呈现随机堆叠与透明重叠,导致传统基于自然图像设计的模型难以区分目标与背景噪声;在构建过程中,数据采集需应对真实安检场景中违禁品出现频率极低的问题,使得阳性样本稀缺,同时人工标注需处理图像中物体尺度、视角及类内差异的巨大变化,并克服复杂背景与无意义上下文的干扰,这些因素共同加剧了数据集的构建难度与模型训练的稳定性挑战。
常用场景
经典使用场景
在公共安全领域,X射线安检图像分析是保障交通枢纽与公共场所安全的关键技术。SIXray数据集作为大规模重叠X射线图像基准,其经典使用场景聚焦于复杂背景下的违禁物品自动识别。该数据集模拟真实安检环境,其中物品随机堆叠且高度重叠,为深度学习模型提供了训练与评估平台,尤其适用于研究重叠图像中多类别违禁物品的检测与分类任务。
衍生相关工作
围绕SIXray数据集,学术界衍生出一系列经典研究工作。其中,类别平衡层次细化(CHR)方法通过反向连接融合多层次视觉线索,成为处理重叠与不平衡数据的基准框架。后续研究进一步探索了基于穿透假设的物理模型改进、弱监督定位算法的优化,以及将重叠图像分析技术迁移至自然图像处理等领域,持续拓展了计算机视觉在安检场景中的应用边界。
数据集最近研究
最新研究方向
在公共安全领域,X射线安检图像分析作为计算机视觉的前沿应用,正面临复杂背景与物品重叠带来的识别挑战。SIXray数据集以其百万级规模与真实场景下的重叠图像特性,为违禁品检测研究提供了关键基准。当前研究聚焦于解决数据极度不平衡与重叠物体建模问题,例如通过类别平衡分层细化(CHR)方法,利用高层语义线索指导中层特征优化,有效提升小样本类别的识别精度。该方向与弱监督定位技术结合,探索在有限标注下实现精准物体定位,为实际安检场景中的高效自动化检测开辟了新路径,具有重要的工业应用价值与学术意义。
相关研究论文
  • 1
    SIXray : A Large-scale Security Inspection X-ray Benchmark for Prohibited Item Discovery in Overlapping Images中国科学院大学 · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作