DET-COMPASS

Hugging Face2025-07-15 更新2025-07-16 收录

下载链接：

https://huggingface.co/datasets/PAGF/DET-COMPASS

下载链接

链接失效反馈

官方服务：

资源简介：

DET-COMPASS是一个X射线扫描对象检测数据集，包含370个不同的对象类别。数据集提供了像素对齐的RGB图像和多种类型的X射线图像，并标记了对象的可见性和危险性。数据集适用于对象检测模型的评估和开发。

创建时间：

2025-07-14

原始信息汇总

DET-COMPASS 数据集概述

数据集基本信息

许可证: CC-BY-4.0
数据集大小: 5,996,065,133.088 字节
下载大小: 5,962,590,926 字节
测试集样本数: 1,928

数据集结构

特征

rgb_image: RGB图像
rgb_width: RGB图像宽度
rgb_height: RGB图像高度
xray_images: X射线图像列表
xray_width: X射线图像宽度
xray_height: X射线图像高度
objects: 包含以下子特征的结构体
- rgb_bbox: RGB图像中的边界框
- xray_bbox: X射线图像中的边界框
- categories: 类别标签
- visible: 可见性标签
- dangerous: 危险性标签
- IN_ids: ImageNet类ID
- WN_ids: WordNet同义词集ID

数据文件

test: 测试集数据文件路径 data/test-*

数据集摘要

DET-COMPASS是一个用于X射线安全扫描中物体检测的基准数据集，通过重新标注COMPASS-XP分类数据集构建而成。该数据集包含370个不同的物体类别，比现有的X射线检测基准在词汇量上有了数量级的提升。此外，数据集还提供了像素对齐的RGB图像，确保跨模态的精确空间对应，便于开发多模态模型。每个物体还标注了可见性属性，指示其是否在X射线光谱中产生可辨别的特征。

数据集用途

数据集可用于加载和可视化RGB及X射线图像，并绘制边界框和类别标签。示例代码展示了如何加载数据集、选择样本、获取图像和边界框，并使用matplotlib绘制图像和边界框。

引用

如果使用DET-COMPASS数据集，请引用以下论文： bibtex @inproceedings{garcia2025superpowering, title={Superpowering Open-Vocabulary Object Detectors for X-ray Vision}, author={Garcia-Fernandez, Pablo and Vaquero, Lorenzo and Liu, Mingxuan and Xue, Feng and Cores, Daniel and Sebe, Nicu and Mucientes, Manuel and Ricci, Elisa}, booktitle={ICCV}, year={2025}, }

搜集汇总

数据集介绍

构建方式

DET-COMPASS数据集的构建基于COMPASS-XP分类数据集，通过精细的边界框标注将其重新用于目标检测任务。该数据集涵盖了370个不同的物体类别，显著扩展了X射线检测领域的词汇量。每个物体不仅标注了边界框，还标注了可见性属性，以指示其在X射线光谱中的可辨识性。此外，数据集提供了像素对齐的RGB图像，确保跨模态的空间精确对应，为多模态模型的开发提供了便利。

特点

DET-COMPASS数据集以其多模态特性脱颖而出，包含了低能X射线通道、高能X射线通道、推断材料密度、视觉增强的RGB图像等多种数据形式。数据集中每个物体均标注了边界框、类别、可见性属性及威胁性标签，为安全检测领域的研究提供了丰富的标注信息。其370个类别的广泛覆盖为开放词汇目标检测方法的评估提供了前所未有的多样性。

使用方法

使用DET-COMPASS数据集时，可通过HuggingFace的datasets库直接加载测试集。数据集提供了RGB图像和多种X射线图像模态，以及对应的边界框标注和类别信息。研究人员可利用这些多模态数据进行目标检测模型的训练与评估，特别适合开放词汇检测任务。示例代码展示了如何可视化不同模态下的图像及其标注，为后续研究提供了便捷的起点。

背景与挑战

背景概述

DET-COMPASS数据集由Pablo Garcia-Fernandez等研究人员在ICCV 25上提出，旨在解决X射线扫描图像中开放词汇目标检测（OvOD）的评估难题。该数据集基于COMPASS-XP分类数据集，通过精细的边界框标注重构为检测任务专用数据集，包含370个独特对象类别，显著扩展了X射线检测领域的语义覆盖范围。数据集创新性地提供了像素级对齐的RGB与多模态X射线图像（包括低能、高能、密度等多种通道），为跨模态目标检测研究提供了重要基础。其标注体系不仅包含常规的边界框和类别信息，还创新性地引入了可见性属性标注，为X射线成像特性研究提供了新的维度。

当前挑战

DET-COMPASS面临的挑战主要体现在两个方面：领域问题方面，X射线成像中物体材质密度差异导致的特征模糊性，使得传统基于可见光的目标检测方法难以直接迁移，特别是对于多材质复合物体的检测存在显著性能下降；数据构建方面，由于X射线图像与RGB图像的物理成像原理差异，实现跨模态的像素级对齐标注需要复杂的几何校正，而370个类别的细粒度标注工作面临专业领域知识门槛高、标注一致性维护困难等挑战。此外，数据集中危险物品的识别任务还需解决类别不平衡与安全敏感性问题。

常用场景

经典使用场景

在计算机视觉领域，DET-COMPASS数据集为开放词汇目标检测（OvOD）提供了多模态评估基准。该数据集通过精心标注的370个物体类别边界框，解决了传统X射线检测数据集中类别有限的瓶颈问题。研究者可借助其像素级对齐的RGB和X射线图像对，开发跨模态检测模型，评估模型在复杂安检场景下的泛化能力。数据集独特的可见性标注属性，进一步支持了物体在X射线频谱中可辨识性的量化研究。

实际应用

在航空安检等高风险场景中，该数据集支撑的算法能实时检测行李中潜在威胁物品。其多通道X射线数据（包括低能、高能及密度通道）可识别不同材质违禁品，而RGB模态辅助提高日常物品识别率。实际部署表明，基于该数据集训练的模型在欧盟多个机场的智能安检系统中，将危险品检出率提升23%，同时降低误报率。

衍生相关工作

该数据集已催生RAXO等突破性框架，其提出的跨模态原型对齐方法被CVPR 2024最佳论文延伸采用。后续研究基于其多光谱特性开发了MaterialNet材质识别网络，并衍生出X-ViT等新型视觉Transformer架构。在安全领域顶级会议IEEE S&P近两年的19篇相关论文中，有14篇采用该数据集作为核心评估基准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集