five

Real-IAD

收藏
arXiv2024-03-19 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2403.12580v1
下载链接
链接失效反馈
官方服务:
资源简介:
Real-IAD是一个大规模、真实世界的工业异常检测多视角数据集,包含15万个高分辨率图像,涵盖30种不同物体,比现有数据集大一个数量级。该数据集具有更广泛的缺陷区域和比例,更具挑战性。为了使数据集更接近实际应用场景,采用了多视角拍摄方法,并提出了样本级评估指标。

Real-IAD is a large-scale, real-world multi-view dataset for industrial anomaly detection. It contains 150,000 high-resolution images covering 30 distinct object categories, and is an order of magnitude larger than existing datasets. This dataset features more extensive defect regions and varying scales, rendering it more challenging. To better align the dataset with real-world application scenarios, a multi-view capture approach was adopted, and a sample-level evaluation metric was proposed.
创建时间:
2024-03-19
搜集汇总
数据集介绍
main_image_url
构建方式
Real-IAD 数据集的构建过程分为三个主要阶段:材料准备、原型构建和数据采集、标注与清洗。首先,收集了30种不同材质的工业产品,并手动制造了多种类型的缺陷。其次,构建了一个包含五个相机的原型设备,用于从不同角度拍摄产品图像。最后,对图像进行人工确认和像素级标注,并通过级联 RCNN 进行置信学习,确保数据质量。
特点
Real-IAD 数据集具有以下特点:1)多样性:覆盖更广泛的类别,提供更丰富的场景;2)大规模:包含超过15万个图像,是现有数据集的10倍以上;3)挑战性:具有更高的难度,可以推动当前异常检测算法的发展和进步。
使用方法
Real-IAD 数据集可以用于无监督和完全无监督的异常检测。无监督异常检测设置中,算法仅从正常样本中学习模式和结构。完全无监督异常检测设置中,训练过程中允许一定比例的异常样本,更接近实际应用场景。
背景与挑战
背景概述
工业异常检测(IAD)领域近年来备受关注并取得了快速发展。然而,由于数据集的限制,IAD 方法的最新进展遇到了一些困难。一方面,大多数最先进的方法在主流数据集(如 MVTec)上已经达到饱和(AUROC 超过 99%),导致方法之间的差异难以区分,公共数据集与实际应用场景之间存在着显著的差距。另一方面,由于数据集规模的限制,对各种新实际异常检测设置的研究受到限制,导致评估结果存在过拟合的风险。因此,我们提出了一种大规模、真实世界和多视角的工业异常检测数据集,名为 Real-IAD,包含 30 种不同物体的 15 万张高分辨率图像,比现有数据集大一个数量级。它具有更大的缺陷区域和比例比例范围,比以前的数据集更具挑战性。为了使数据集更接近实际应用场景,我们采用了多视角拍摄方法,并提出了样本级评估指标。此外,除了通用的无监督异常检测设置外,我们还基于观察工业生产中的良品率通常大于 60%的事实,提出了一个新的完全无监督工业异常检测(FUIAD)设置,这具有更多的实际应用价值。最后,我们在 Real-IAD 数据集上报告了流行 IAD 方法的性能,为 IAD 的发展提供了一个极具挑战性的基准。
当前挑战
Real-IAD 数据集的创建旨在解决工业异常检测领域的一些挑战。首先,现有数据集的缺陷范围较小,实际应用场景简单。近年来,方法在 I-AUROC(图像级)和 PAUROC(像素级)指标上超过了 99%,这使得难以区分新方法的优点。其次,数据集的规模也有限,MVTec AD 中的一些类别只有大约 60 张或更少的缺陷图像,由少量测试图像引起的随机误差不能忽略。一些新的 IAD 研究在训练集中使用一些缺陷图像,导致测试集更小,加剧了这个问题。在对象多样性方面,MVTec AD 包含 15 种类型的对象,VisA 包含 12 种类型的对象。对象类型的数量有限影响了统一模型能力的评估,导致模型指标过于乐观。此外,当前数据集的设置与理想的应用场景之间存在差距。虽然 IAD 是无监督学习,但训练集仍然需要手动注释。这个过程可能会引入噪声样本,例如 SoftPatch 中提出的 BTAD 训练集中的噪声样本。此外,主流 2D IAD 数据集由单视角图像组成,但在实际应用中,零件结构复杂,单一视角无法覆盖所有缺陷。虽然一些数据集,如 MVTec AD-3D,试图从 3D 视角解决多视角问题,但 3D 传感器的成本限制了它们在实际应用中的使用。
常用场景
经典使用场景
在工业生产过程中,产品质量检测是确保产品符合标准的关键步骤。Real-IAD数据集作为一种真实世界、多视角的工业异常检测数据集,为工业异常检测研究提供了宝贵的资源。它包含了150K高分辨率图像,涵盖了30种不同类型的产品,并提供了从多个角度拍摄的图像,这为研究者在模拟实际生产场景下进行算法评估和改进提供了可能。Real-IAD数据集在工业视觉检测、质量控制系统以及智能工厂的构建等方面具有广泛的应用前景。
解决学术问题
当前工业异常检测领域面临的主要挑战之一是数据集的局限性。现有的数据集规模较小,缺陷类型和比例范围有限,导致算法性能评估存在偏差,且难以区分不同方法之间的优劣。Real-IAD数据集通过提供大规模、多样化的数据,有效地解决了这一问题。它包含的图像数量和类别数量远超现有数据集,且缺陷区域和比例范围更大,使得数据集更具挑战性。此外,Real-IAD数据集还考虑了多视角问题,进一步提升了算法在实际应用中的适用性。Real-IAD数据集的提出,为工业异常检测领域的研究提供了新的方向和思路,有助于推动该领域的技术发展和进步。
衍生相关工作
Real-IAD数据集的提出,激发了工业异常检测领域的研究热潮。基于Real-IAD数据集,研究者们开发了多种新的算法和方法,取得了显著的成果。例如,一些研究者利用Real-IAD数据集进行无监督异常检测算法的研究,提出了基于数据增强、重构和嵌入的方法,有效地提高了算法的性能。此外,还有一些研究者利用Real-IAD数据集进行半监督、少样本和零样本等场景下的异常检测研究,为实际应用提供了更多可能性。Real-IAD数据集的衍生工作,不仅推动了工业异常检测领域的技术发展,也为其他相关领域的研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作