MIAD
收藏arXiv2022-11-28 更新2024-06-21 收录
下载链接:
https://miad-2022.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
MIAD数据集是由商汤科技研究院创建,专注于户外维护检查的无监督异常检测。该数据集包含超过10万张高分辨率彩色图像,涵盖多种户外工业场景,如光伏模块、风力涡轮机叶片等。数据集通过3D图形软件BlenderProc生成,模拟了表面和逻辑异常,并提供像素级精确的地面实况。MIAD数据集旨在解决户外维护检查中的异常检测问题,特别是在不受控制的环境因素影响下的应用。
The MIAD dataset was created by SenseTime Research Institute, focusing on unsupervised anomaly detection for outdoor maintenance inspection. It includes over 100,000 high-resolution color images covering diverse outdoor industrial scenarios such as photovoltaic modules and wind turbine blades. Generated via the 3D graphics software BlenderProc, the dataset simulates both surface and logical anomalies and provides pixel-accurate ground truth. The MIAD dataset is designed to address the anomaly detection problems in outdoor maintenance inspection, especially for applications affected by uncontrolled environmental factors.
提供机构:
商汤科技研究院
创建时间:
2022-11-25
搜集汇总
数据集介绍

构建方式
在工业维护检测领域,现有数据集多集中于受控室内环境,难以应对户外复杂场景的挑战。MIAD数据集采用BlenderProc三维图形软件构建,通过程序化渲染技术生成超过10万张高分辨率彩色图像。该构建流程首先初始化三维场景并加载相机配置,随后通过物理渲染技术同步生成RGB图像与像素级精确标注。为模拟户外不可控因素,研究团队设计了三个专门模块:通过混合着色器随机改变物体表面材质以模拟灰尘或锈蚀;随机更换背景图像或移动背景物体以模拟杂乱环境;在球坐标系中随机采样相机位置以模拟多变的拍摄视角。这种合成方法确保了数据分布的多样性与真实性,同时避免了昂贵的人工标注成本。
特点
作为专注于户外维护检测的无监督异常检测数据集,MIAD呈现出若干显著特征。其规模远超现有同类数据集,涵盖光伏组件、风力涡轮机叶片、螺母螺栓等七类真实工业场景,每类包含一万张训练图像与五千张测试图像。该数据集系统性地引入了三种户外不可控因素:多变视角、杂乱背景与表面退化,这些因素共同构成了更具挑战性的数据分布。异常类型同时覆盖表面异常(如划痕、凹痕)与逻辑异常(如部件缺失或错位),拓展了检测任务的范畴。此外,数据集提供了像素级精确的异常区域标注,并专门引入了低误报率下的召回率指标,以更好地满足工业应用对低误报率的严格要求。
使用方法
该数据集主要用于评估无监督异常检测算法在户外复杂环境下的性能。研究人员可按照标准流程划分训练集与测试集,训练集仅包含正常样本,测试集则混合正常与各类异常样本。评估时需生成单通道异常热力图,其中高值对应异常像素,并通过最大池化获得图像级异常分数。性能度量采用图像级AUROC与1%误报率下的召回率,后者更贴合工业低误报需求;像素级评估则使用归一化每区域重叠曲线下面积。研究可聚焦于不同异常类型(表面/逻辑)的检测难度差异,或定量分析各不可控因素对算法性能的影响。大规模训练样本也为探索数据高效利用方法提供了新的实验平台。
背景与挑战
背景概述
在工业视觉检测领域,无监督异常检测因其仅需正常样本进行训练的特性,已成为应对缺陷样本稀缺问题的关键技术。然而,现有数据集如MVTec AD多聚焦于受控环境下的制造检测,难以应对户外维护巡检所面临的复杂挑战。为此,商汤科技、京东及上海交通大学的研究团队于2022年联合推出了维护巡检异常检测数据集MIAD。该数据集旨在填补户外无监督异常检测研究的空白,其核心研究问题在于探索在视角多变、背景杂乱、物体表面长期劣化等非受控环境下,如何实现高效、精准的设备异常识别。MIAD通过三维图形软件生成了涵盖光伏板、风力涡轮机叶片等七种户外工业场景的超过十万张高分辨率图像,并提供了像素级标注,极大地推动了户外工业异常检测算法的发展与评估。
当前挑战
MIAD数据集所应对的核心领域挑战,在于解决户外维护巡检场景下的无监督异常检测难题。与室内制造检测不同,户外环境引入了视角无控、背景无控和表面无控三大因素,导致正常样本的分布极为复杂,严重破坏了现有先进算法所依赖的像素级对齐等先验假设,致使模型性能出现显著下降。在数据集构建过程中,挑战同样突出:其一,真实户外工业场景数据获取成本高昂,且缺陷样本稀少,难以满足大规模训练需求;其二,为生成像素级精确标注,研究团队需利用BlenderProc等三维渲染管线,精心设计流程以模拟上述三种非受控因素,并确保训练集与测试集的数据分布既相似又无泄漏,这对场景建模与参数化控制提出了极高要求。
常用场景
经典使用场景
在工业视觉异常检测领域,MIAD数据集主要应用于模拟户外维护检查场景下的无监督异常检测算法评估与开发。该数据集通过三维图形软件构建,精准复现了光伏组件、风力涡轮叶片、电气绝缘子等七类户外工业场景,并引入了不受控的摄像机视角、杂乱背景及物体表面退化等真实环境变量。其经典使用场景在于为算法提供大规模、高分辨率的训练与测试图像,使研究者能够在接近真实世界的复杂条件下,验证模型对表面异常与逻辑异常的检测与定位能力。
实际应用
在实际工业应用中,MIAD数据集能够直接支持电力传输线路、光伏电站、风力发电厂等户外设施的自动化维护检查系统开发。通过无人机或轨道检测车辆采集的图像常受视角、背景及表面状态影响,该数据集模拟的这些因素使得基于其训练的算法更易于迁移到真实检测任务中。例如,在电气绝缘子缺陷检测或螺栓松动识别等场景,利用MIAD进行算法预训练与验证,可显著提升系统在多变户外环境下的异常检出率与定位精度,降低人工复检成本,推动工业视觉检测技术从室内产线向户外基础设施维护的拓展。
衍生相关工作
自MIAD数据集发布以来,已催生了一系列针对户外复杂场景的无监督异常检测方法改进与比较研究。基于该数据集,学者们对重构类、表征类、标准化流类及数据增强类等代表性算法进行了系统评估,揭示了各类方法在表面异常与逻辑异常上的性能差异。例如,研究显示DRAEM在表面异常检测上表现更优,而Reverse Distillation则更擅长处理逻辑异常。这些工作不仅深化了对算法在不受控环境下失效机制的理解,也促进了如低误报率优化、大规模正常样本利用等新研究方向的涌现,为户外维护检查的算法设计提供了重要参考。
以上内容由遇见数据集搜集并总结生成



