DET-COMPASS
收藏arXiv2025-03-21 更新2025-03-25 收录
下载链接:
https://github.com/PAGF188/RAXO
下载链接
链接失效反馈官方服务:
资源简介:
DET-COMPASS数据集是一个新的基准,包含370个不同对象类别的边界框注释,为开放词汇对象检测在X射线模态下的评估提供了广泛而多样的类别集合。该数据集通过复用COMPASS-XP分类数据集并精心标注边界框而创建,提供了像素级对齐的X射线和RGB图像,有助于多模态模型的发展。
The DET-COMPASS dataset is a novel benchmark containing bounding box annotations for 370 distinct object categories, which provides a comprehensive and diverse set of categories for evaluating open-vocabulary object detection in the X-ray modality. This dataset is developed by reusing the COMPASS-XP classification dataset and carefully annotating bounding boxes, and it offers pixel-aligned X-ray and RGB images to facilitate the advancement of multimodal models.
提供机构:
圣地亚哥德孔波斯特拉大学, 西班牙
创建时间:
2025-03-21
搜集汇总
数据集介绍

构建方式
DET-COMPASS数据集的构建基于COMPASS-XP分类数据集,通过精心的人工标注流程扩展了边界框注释。该数据集包含1,928对X射线和RGB图像,每对图像都经过专家同步标注,确保跨模态的空间对齐。标注过程由三名专家完成,每人负责50%的数据标注,随后进行集体审查以消除差异,最终形成了包含370个物体类别的高质量检测基准。
特点
DET-COMPASS是当前X射线检测领域中类别最丰富的基准数据集,涵盖370个物体类别,远超现有数据集的类别规模。其独特之处在于提供了像素级对齐的X射线与RGB图像对,并标注了物体在X射线频谱中的可见性属性。每个X射线模态的物体标注均包含可见性标签,区分是否产生可辨识的X射线特征,为跨模态研究提供了重要支持。
使用方法
该数据集支持开放词汇物体检测(OvOD)在X射线领域的评估与研究。用户可通过边界框标注进行大规模模型测试,尤其适用于跨模态检测任务。数据集的RGB-X射线对齐特性便于开发多模态模型,而可见性标签可用于分析物体在X射线成像中的表现差异。研究人员可基于此基准比较不同OvOD方法在安全检测等实际场景中的泛化能力。
背景与挑战
背景概述
DET-COMPASS数据集由西班牙圣地亚哥德孔波斯特拉大学、意大利布鲁诺·凯斯勒基金会和特伦托大学的研究团队于2025年提出,旨在推动X射线影像领域的开放词汇目标检测(OvOD)研究。该数据集基于COMPASS-XP分类数据集构建,通过人工标注扩充了370个物体类别的边界框注释,成为首个提供像素级对齐的X射线与RGB双模态检测基准。其核心研究问题聚焦于解决安全筛查场景中传统检测模型受限于封闭类别集的痛点,通过引入跨模态特征对齐机制,显著提升了模型对未知威胁物品的识别能力。作为当前类别覆盖最广的X射线检测基准,DET-COMPASS通过整合材料属性标注和可见性标签,为多模态学习与开放世界感知研究提供了重要基础设施。
当前挑战
DET-COMPASS面临的挑战主要体现在两个方面:领域问题层面,X射线影像特有的穿透性成像机制导致物体表观特征与RGB模态存在显著差异,传统基于文本对齐的OvOD方法因模态鸿沟面临特征失配问题;数据构建层面,安全敏感场景的X射线样本获取成本高昂,且跨模态标注需保持严格的几何一致性,研究团队通过创新性材料迁移机制和双重检索策略,在缺乏大规模标注数据的情况下构建了高质量的跨模态描述符。此外,数据集中部分物体的X射线可见性差异(如纺织品类物品穿透性特征微弱)也为模型鲁棒性评估提出了新的挑战。
常用场景
经典使用场景
在X射线安全检查领域,DET-COMPASS数据集通过提供370个物体类别的边界框标注,为开放词汇目标检测(OvOD)研究提供了标准化评估基准。该数据集特别适用于研究跨模态(RGB-X射线)物体识别,其像素级对齐的多模态特性使得研究者能够开发出在复杂安检场景中识别任意用户定义物体的算法。
实际应用
在实际安检场景中,该数据集支撑的系统可动态识别新型违禁品,如机场安检中实时检测未训练过的电子产品变种。通过结合双源检索策略(网络RGB图像与合成X射线样本),显著提升了对刀具、液体容器等危险物品的检测准确率,平均mAP提升达17.0点,大幅降低人工复检率。
衍生相关工作
基于DET-COMPASS的基准特性,已衍生出OVXD、BARON等跨模态检测框架。其材料传输机制启发了后续X射线合成数据生成研究,而视觉描述符构建方法被改进应用于工业质检领域。数据集提供的370类层级化标注体系,更成为后续HiXray等扩展数据集构建的参考标准。
以上内容由遇见数据集搜集并总结生成



