MVTec AD, MVTec 3D-AD
收藏arXiv2022-05-30 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2205.14852v1
下载链接
链接失效反馈官方服务:
资源简介:
MVTec AD数据集包含15个类别,共计3629张训练图像和1725张测试图像,主要用于无监督异常检测和定位研究。MVTec 3D-AD数据集则是新推出的,包含超过4000个高分辨率的3D扫描工业产品图像,用于3D空间中的无监督异常检测。这两个数据集均由工业界提供,旨在通过提供精细的异常样本和像素级异常分割标注,推动计算机视觉领域中异常检测技术的发展。
The MVTec AD dataset consists of 15 categories, with a total of 3629 training images and 1725 test images, and is mainly used for unsupervised anomaly detection and localization research. The newly released MVTec 3D-AD dataset contains over 4000 high-resolution 3D scanned industrial product images and is designed for unsupervised anomaly detection in 3D space. Both datasets are provided by industrial sectors, aiming to promote the development of anomaly detection technologies in the field of computer vision by offering fine-grained anomalous samples and pixel-level anomaly segmentation annotations.
提供机构:
中国科学院大学
创建时间:
2022-05-30
搜集汇总
数据集介绍

构建方式
在工业视觉异常检测领域,MVTec AD与MVTec 3D-AD数据集的构建体现了对真实场景缺陷的精细模拟。MVTec AD包含15个类别,涵盖物体与纹理,训练集仅含正常样本,测试集则混合正常与多种异常图像,并提供了像素级异常分割标注。MVTec 3D-AD则扩展至三维空间,采集了10类工业产品的高分辨率3D扫描,包含孔洞、污染、裂纹等五种异常类型,同样遵循仅使用正常样本训练的原则。数据收集过程注重实际制造环境中的细微缺陷,确保了数据集的实用性与挑战性。
特点
该数据集的核心特点在于其高度的现实相关性与精细的标注粒度。MVTec AD涵盖了从宏观物体到微观纹理的多样类别,异常类型包括结构缺陷、表面污染等,与工业质检中的真实缺陷高度吻合。MVTec 3D-AD则引入了三维点云数据,弥补了以往缺乏三维异常检测基准的空白。两个数据集均提供了像素级或点云级的异常定位标注,支持对模型进行细粒度评估。此外,数据集中存在的标注模糊案例也为算法鲁棒性研究提供了重要参考。
使用方法
在无监督异常检测任务中,该数据集通常按类别独立使用。研究人员针对每个类别,仅使用其正常样本训练模型,随后在包含正常与异常样本的测试集上进行评估。评估指标包括图像级的AUROC与像素级的PRO或AUROC,以全面衡量检测与定位性能。对于MVTec 3D-AD,既可单独使用RGB信息延续二维方法,也可结合三维点云探索新算法。数据集的统一接口设计便于公平比较不同方法的推理效率与精度,推动工业视觉算法的实用化发展。
背景与挑战
背景概述
在计算机视觉领域,无监督异常检测与定位作为一项极具实用价值与挑战性的任务,近年来备受关注。MVTec AD数据集由MVTec公司于2019年推出,旨在解决工业制造场景中细粒度异常检测的难题。该数据集涵盖15个类别,包含3629张训练图像与1725张测试图像,提供了像素级异常分割标注,推动了基于重建与表示学习的方法发展。随后,为填补三维空间异常检测基准的空白,MVTec 3D-AD数据集于2021年发布,包含10个类别的高分辨率三维扫描数据,进一步拓展了研究边界。这些数据集由学术界与工业界合作构建,核心研究问题聚焦于在无需异常样本训练的前提下,实现精准的异常识别与定位,对智能制造、医疗影像等领域产生了深远影响。
当前挑战
MVTec AD与3D-AD数据集面临的挑战主要体现在两方面:其一,在解决领域问题方面,异常检测任务需应对正常与异常样本分布极不均衡、异常形态多样且细微的难题,例如工业零件中的划痕或污染,这要求模型具备强大的特征分辨能力与泛化性;其二,在构建过程中,数据采集与标注面临严峻挑战,包括真实异常样本稀缺、像素级标注成本高昂,以及现有标注存在模糊性问题——如部分异常区域未标注或标注粗糙,影响了模型评估的准确性。此外,三维数据的引入带来了点云处理、多模态融合等新挑战,如何有效利用RGB与深度信息提升检测性能仍需深入探索。
常用场景
经典使用场景
在工业视觉质检领域,MVTec AD数据集已成为无监督异常检测与定位任务的核心基准。该数据集通过提供15个类别、涵盖纹理与物体的精细标注图像,为算法模型构建了接近真实制造场景的评估环境。其经典使用场景体现在模型训练仅使用正常样本,测试时则需同时处理正常与异常图像,这种设定精准模拟了工业生产中缺陷样本稀缺的实际困境,推动了重建基与表征基两大方法流派的演进与比较。
实际应用
在实际工业应用中,MVTec AD数据集直接服务于智能制造与自动化质检系统。其涵盖的电缆、胶囊、金属螺母等类别对应了电子装配、制药封装、机械制造等具体产线场景。基于该数据集训练的模型能够自动检测产品表面的划痕、污染、裂纹等缺陷,实现高精度定位与分类,显著降低人工质检成本并提升生产效率。数据集提供的标准化评估指标,如图像级AUROC与像素级PRO,为工业场景中模型部署的可靠性提供了量化依据,促进了学术成果向产业应用的平滑转化。
衍生相关工作
围绕MVTec AD数据集衍生出一系列经典研究工作,形成了无监督异常检测的方法体系。重建基方法如DRAEM利用去噪自编码器学习正常图像重构,通过差异图定位异常;表征基方法则涌现出PatchCore、PaDim等代表性工作,前者构建最大代表性记忆库并采用k近邻搜索,后者通过多维高斯分布建模特征空间。此外,FastFlow、CFLOW-AD等基于归一化流的方法实现了端到端的高效推理。这些工作不仅提升了数据集的性能上限,更推动了整个领域从特征提取、分布估计到距离度量的方法论创新。
以上内容由遇见数据集搜集并总结生成



