five

CXR-AD

收藏
arXiv2025-05-06 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2505.03412v1
下载链接
链接失效反馈
官方服务:
资源简介:
CXR-AD数据集是首个针对半导体组件X射线图像的公开异常检测数据集,包含来自现实世界工业生产环境的真实X射线图像。数据集涵盖了五个工业组件类别,包括653个正常样本和561个缺陷样本,并具有精确的像素级掩码标注。该数据集旨在为异常检测算法提供新的视角,并为评估算法提供一个新基准。数据集提出了几个关键挑战,包括复杂背景和细微异常、多尺度异常分布以及高检测难度。

The CXR-AD dataset is the first publicly available anomaly detection dataset targeting X-ray images of semiconductor components. It contains real X-ray images collected from real-world industrial production environments. The dataset covers five industrial component categories, including 653 normal samples and 561 defective samples, and is equipped with precise pixel-level mask annotations. This dataset aims to provide a new perspective for anomaly detection algorithms and a novel benchmark for algorithm evaluation. Additionally, the dataset poses several key challenges, including complex backgrounds and subtle anomalies, multi-scale anomaly distributions, and high detection difficulty.
提供机构:
中山大学航空航天学院
创建时间:
2025-05-06
搜集汇总
数据集介绍
main_image_url
构建方式
在工业质量控制领域,X射线成像技术因其穿透性优势成为检测内部缺陷的重要手段。CXR-AD数据集的构建采用了德国YXLON Cheetah微焦点X射线检测系统,该系统配备16位动态范围的平板探测器,可在单次曝光中同步捕捉金属结构等高密度区域与塑料间隙等低密度区域的细节。数据采集在恒温恒湿实验室环境下完成,覆盖CDIP、CFP16等五种典型半导体封装类型,共包含653个正常样本和561个缺陷样本。标注过程采用LabelMe工具进行像素级多边形轮廓标注,每个样本平均经过5-8次顶点微调,最终通过OpenCV库将JSON标注转换为二进制掩膜图像,并开发自动化校验模块确保标注几何一致性。
特点
该数据集呈现出三大显著特征:首先,缺陷区域与复杂内部结构存在强耦合性,87%的缺陷面积小于最大缺陷区域的1%,需模型具备微观特征捕捉能力;其次,X射线成像固有的低对比度特性使缺陷区域平均局部对比度(LC)仅0.1091,灰度值集中分布在50-150区间(占比95.47%);最后,缺陷形态呈现多尺度分布,包括气泡、裂纹等7类真实工业缺陷,其中跨层结构缺陷的灰度差异显著。这些特性使得现有算法在CXR-AD上的平均性能较MVTec AD下降29.78%,突显其作为工业检测基准的挑战性。
使用方法
该数据集支持三种主流异常检测范式:基于特征嵌入的方法如PatchCore通过构建正常特征记忆库进行比对;基于重建的方法如ONENIP利用预测编码理论指导特征重建;零样本方法如AdaCLIP结合可学习提示词实现跨模态检测。评估采用图像级/像素级AUROC双指标,需注意输入图像统一缩放至256×256像素并中心裁剪。实验表明,X射线图像的低信噪比会导致特征嵌入方法出现23%的像素AUROC下降,而重建方法在微小缺陷边界处易产生模糊现象。使用者应重点关注局部特征增强策略与多尺度融合架构的设计。
背景与挑战
背景概述
CXR-AD数据集由中山大学等机构的研究团队于2024年构建,是首个针对工业组件内部缺陷检测的公开X射线图像数据集。该数据集聚焦半导体制造领域的关键质量问题,包含5类工业组件的1214张高分辨率X射线图像,其中561张缺陷样本均带有精确的像素级标注。作为MVTec AD在内部缺陷检测领域的延伸,CXR-AD填补了现有数据集仅关注表面缺陷的空白,其采用的微焦点X射线成像技术可清晰呈现组件内部的气泡、裂纹等微观缺陷,为工业无损检测技术发展提供了重要的基准平台。
当前挑战
该数据集面临三重核心挑战:在领域问题层面,X射线图像中复杂内部结构与缺陷区域的强耦合性导致特征解耦困难,缺陷平均局部对比度仅0.1091的极低信噪比大幅提升检测难度;构建过程中需克服16位动态范围图像的标注难题,单个样本需5-8次顶点微调才能精确匹配缺陷边缘;算法层面,87%的小尺度缺陷分布与多形态缺陷共存导致现有方法平均性能下降29.78%,特征嵌入类方法在跨模态迁移时出现显著性能衰减,重建类方法面临低对比度下的边界模糊问题。
常用场景
经典使用场景
CXR-AD数据集在工业异常检测领域具有重要应用价值,尤其在半导体组件内部缺陷检测方面表现突出。该数据集通过X射线成像技术捕捉了半导体组件内部的真实缺陷,包括气泡、裂纹等常见问题。研究人员可以利用该数据集训练和评估各种异常检测算法,特别是在处理低对比度、高噪声的X射线图像时,能够有效测试算法的鲁棒性和准确性。
解决学术问题
CXR-AD数据集解决了工业异常检测领域中的几个关键学术问题。首先,它填补了公开X射线数据集在内部缺陷检测方面的空白,为相关研究提供了宝贵的数据支持。其次,数据集中的复杂背景和细微异常区域为算法开发提供了更具挑战性的测试环境。此外,多尺度异常分布和低对比度特性也为算法优化提供了明确方向。
衍生相关工作
CXR-AD数据集的发布催生了一系列相关研究工作。例如,有研究团队基于该数据集开发了针对X射线图像的专用异常检测算法,显著提升了在低对比度条件下的检测性能。此外,该数据集还被用于评估多模态大语言模型在工业检测任务中的表现,推动了跨领域技术的融合与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作