Industrial Screen Printing Anomaly Detection dataset (ISP-AD)

Name: Industrial Screen Printing Anomaly Detection dataset (ISP-AD)
Creator: 聚合物竞争力中心Leoben GmbH, 莱oben, 奥地利。蒙大拿大学莱oben分校材料科学与聚合物测试主席，莱oben, 奥地利。
Published: 2025-03-07 05:56:31
License: 暂无描述

arXiv2025-03-07 更新2025-03-11 收录

下载链接：

http://arxiv.org/abs/2503.04997v1

下载链接

链接失效反馈

官方服务：

资源简介：

ISP-AD数据集是一个大规模的现实世界工业数据集，由聚合物竞争力中心Leoben GmbH和蒙大拿大学莱oben分校共同创建。该数据集包含来自屏幕印刷工业的实际案例，含有允许的设计变异性的结构化模式内嵌入微弱对比度的表面缺陷。数据集规模宏大，包括312674个正常样本和246375个缺陷样本，是迄今为止公开的最大的工业数据集。该数据集旨在促进工业异常检测研究，特别是在无监督、自监督和监督异常检测方法在工业环境中的应用研究。

The ISP-AD dataset is a large-scale real-world industrial dataset co-created by Polymer Competence Center Leoben GmbH and the Leoben campus of the University of Montana. It comprises real-world cases from the screen printing industry, featuring surface defects with weak contrast embedded within structured patterns that have permitted design variability. Boasting a massive scale, the dataset includes 312,674 normal samples and 246,375 defective samples, making it the largest publicly available industrial dataset to date. This dataset is designed to advance industrial anomaly detection research, particularly the application of unsupervised, self-supervised, and supervised anomaly detection methods in industrial environments.

提供机构：

聚合物竞争力中心Leoben GmbH, 莱oben, 奥地利。蒙大拿大学莱oben分校材料科学与聚合物测试主席，莱oben, 奥地利。

创建时间：

2025-03-07

搜集汇总

数据集介绍

构建方式

该数据集的构建方式涉及从真实工业环境中的丝网印刷过程中采集图像，包括无缺陷和有缺陷的样本。数据集由三种不同的光学模式捕获，以增强数据多样性。无缺陷样本经过随机裁剪和增强，而合成缺陷则通过在正常样本上添加随机纹理来生成。真实缺陷样本从有缺陷的样本中手动提取。数据集包括监督和无监督训练数据，用于评估不同方法的性能。

特点

ISP-AD数据集的特点包括：1. 来自真实工业场景的大规模数据；2. 具有高设计变体性的结构化图案中的微小、弱对比度缺陷；3. 三种成像模式，以增强数据多样性；4. 大规模的工业数据划分，适用于无监督和监督设置；5. 包括合成和收集的真实缺陷数据，适用于额外监督；6. 高样本变异性，源于样本本身、预处理和成像条件。

使用方法

使用ISP-AD数据集的方法包括：1. 在无监督设置中，使用无缺陷样本进行训练，以学习正常数据的特征表示；2. 在监督设置中，使用合成和/或真实缺陷样本进行训练，以提高模型的泛化能力；3. 混合监督训练方法，将合成和真实缺陷样本结合使用，以提高检测性能；4. 使用数据集进行性能评估，包括召回率、误报率和曲线下面积等指标。

背景与挑战

背景概述

工业印刷异常检测数据集（ISP-AD）是一个大型的现实世界数据集，旨在推动工业异常检测技术的发展。该数据集由奥地利莱奥本聚合物能力中心（Polymer Competence Center Leoben GmbH）和莱奥本蒙塔纳大学（Montanuniversit¨at Leoben）的材料科学和聚合物测试主席保罗·约瑟夫·克拉辛格（Paul Josef Krassnig）和迪特·保罗·格鲁伯（Dieter Paul Gruber）共同创建。ISP-AD数据集包含了来自工厂车间的合成缺陷和真实缺陷，旨在解决现有数据集在模拟工业场景方面的不足。该数据集包含312,674个无缺陷样本和246,375个缺陷样本，其中245,664个是合成的，711个是真实的。ISP-AD数据集是目前最大的公开可用工业缺陷检测数据集，适用于无监督和监督训练场景。

当前挑战

ISP-AD数据集面临的主要挑战包括：1)数据集中包含小型和对比度较低的表面缺陷，这些缺陷嵌入在高设计变异性结构模式中，对异常检测算法提出了挑战；2)数据集的构建过程中，收集和标记大量无缺陷和有缺陷的数据是一项劳动密集且实际操作难度较大的任务；3)监督方法在泛化到未见过的缺陷方面存在困难；4)现有的公开数据集大多在“实验室条件”下生成，未能捕捉工业环境的复杂性，导致对异常检测方法的实际工业适用性估计过高。

常用场景

经典使用场景

ISP-AD数据集在工业异常检测领域具有广泛的应用。它包含了合成和真实缺陷，能够帮助研究人员评估和提升异常检测方法的性能。数据集的复杂性和多样性使其成为研究工业场景中各种表面缺陷检测的理想平台。此外，ISP-AD数据集还支持监督和无监督的学习方法，为研究人员提供了灵活的研究工具。

衍生相关工作

ISP-AD数据集的发布促进了工业异常检测领域的研究进展。基于ISP-AD数据集，研究人员开发了一系列新的异常检测方法，如混合监督训练方法和无监督学习方法。这些方法在ISP-AD数据集上取得了良好的性能，为工业场景中的异常检测提供了新的解决方案。此外，ISP-AD数据集还激发了研究人员对自监督学习和合成缺陷数据生成等领域的探索，为未来的研究提供了新的方向。

数据集最近研究