Voxel51/PIDray
收藏Hugging Face2025-03-17 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Voxel51/PIDray
下载链接
链接失效反馈官方服务:
资源简介:
PIDray是一个大规模数据集,涵盖了现实场景中的各种违禁品检测案例,特别是故意隐藏的物品。该数据集包含47,677张X射线图像,涵盖了12类违禁品,并提供了高质量的分割掩码和边界框注释。数据集主要用于学术研究,特别是机场安检机中的物品检测。
PIDray is a large-scale dataset encompassing diverse contraband detection cases in real-world scenarios, particularly those involving intentionally hidden items. This dataset comprises 47,677 X-ray images, covers 12 categories of contraband, and provides high-quality segmentation masks and bounding box annotations. The dataset is primarily intended for academic research, especially for object detection tasks in airport security scanners.
提供机构:
Voxel51
原始信息汇总
数据集概述
基本信息
- 数据集名称: PIDray
- 语言: 英语 (en)
- 许可证: Apache-2.0
- 样本数量: 9482
- 大小类别: 1K<n<10K
- 任务类别: 目标检测 (object-detection)
数据集描述
PIDray 是一个大规模数据集,涵盖了现实场景中各种禁止物品检测的情况,特别是故意隐藏的物品。该数据集包含 12 类禁止物品的 47,677 张 X 光图像,具有高质量的标注分割掩码和边界框。
数据集详情
- 类别数量: 12
- 图像数量: 47,677
- 标注类型: 分割掩码和边界框
使用限制
- 用途: 仅限学术用途,禁止商业用途
引用
@inproceedings{wang2021towards, title={Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark}, author={Wang, Boying and Zhang, Libo and Wen, Longyin and Liu, Xianglong and Wu, Yanjun}, booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision}, pages={5412--5421}, year={2021} }
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,针对安检场景中违禁物品检测的挑战,PIDray数据集的构建体现了对现实复杂性的深度考量。该数据集通过收集47,677张X射线图像,涵盖了12类违禁物品,并特别关注了物品被故意隐藏于杂乱物体中的复杂情况。构建过程中,研究团队投入大量精力,为每张图像提供了高质量的实例分割掩码和边界框标注,确保了标注的精确性与一致性,从而为模型训练提供了可靠的基础。
特点
PIDray数据集的核心特征在于其规模与场景的真实性。作为目前已知最大的违禁物品检测数据集,它不仅提供了海量的X射线图像,更关键的是模拟了现实安检中可能遇到的各类复杂情形,如类内差异、类别不平衡以及遮挡问题。数据集特别强调了物品被刻意隐藏的案例,这极大地增强了其在真实世界应用中的代表性与挑战性,为推进鲁棒性检测算法的研究奠定了坚实基础。
使用方法
该数据集主要通过FiftyOne平台进行加载与使用。用户需预先安装FiftyOne库,随后通过其提供的工具从Hugging Face Hub导入数据集。导入后,用户可利用FiftyOne App直观地浏览图像、标注信息并进行初步分析。该流程简化了数据访问与可视化步骤,使得研究人员能够快速将精力集中于算法开发与实验验证,有效服务于安检场景下的目标检测学术研究。
背景与挑战
背景概述
在计算机视觉领域,X射线安检图像中的违禁品检测是保障公共安全的关键技术,然而实际应用常受限于数据集的规模与多样性。为应对这一挑战,中国科学院软件研究所与北京大学的研究团队于2021年联合发布了PIDray数据集,该数据集包含47,677张X射线图像,涵盖12类违禁品,并提供了高质量的边界框与分割掩码标注。PIDray的核心研究问题聚焦于提升在真实复杂场景下,尤其是物品被故意隐藏或遮挡时的检测性能,其大规模与高标注质量显著推动了安检智能识别技术的发展,为相关算法研究提供了重要基准。
当前挑战
PIDray数据集旨在解决X射线安检图像中违禁品检测的领域挑战,包括物品因故意隐藏、杂乱背景遮挡及类内差异导致的识别困难。构建过程中,研究人员面临数据采集与标注的双重挑战:一方面需在真实安检环境中获取涵盖多样隐藏场景的大规模图像,确保数据的代表性与真实性;另一方面,由于X射线图像的透明叠加特性,精确标注被遮挡或重叠的物品边界极为耗时,且需专业领域知识以保证标注质量的一致性。
常用场景
经典使用场景
在计算机视觉领域,X射线安检图像分析一直是极具挑战性的研究方向。PIDray数据集作为大规模禁止物品检测基准,其经典使用场景聚焦于训练和评估目标检测模型,特别是在复杂背景和故意隐藏物品的极端条件下。该数据集通过提供高质量的分割掩码和边界框标注,使研究人员能够深入探索模型在真实安检环境中的鲁棒性和泛化能力,为算法优化提供了坚实的实验基础。
衍生相关工作
围绕PIDray数据集,学术界已衍生出多项经典研究工作。其中,选择性密集注意力网络(SDANet)作为该数据集提出的强基线模型,通过密集注意力模块和依赖细化模块提升了特征学习能力。后续研究在此基础上进一步探索了多尺度特征融合、遮挡处理等方向,推动了X射线安检检测技术的持续进步,并为相关领域提供了可借鉴的算法框架和评估标准。
数据集最近研究
最新研究方向
在X射线安检领域,PIDray数据集作为大规模违禁品检测基准,正推动着计算机视觉技术向实际应用场景的深入拓展。当前研究聚焦于解决复杂环境下的检测难题,如物品的故意隐藏、类内差异及遮挡问题,通过设计先进的深度学习架构,如选择性密集注意力网络,以提升模型在真实场景中的鲁棒性和准确性。该数据集不仅促进了多尺度特征依赖性的探索,还为学术界提供了评估算法性能的重要平台,对提升公共安全领域的自动化检测水平具有深远意义。
以上内容由遇见数据集搜集并总结生成



