MultiView Multi-Illumination Anomaly Detection (M2AD)

Name: MultiView Multi-Illumination Anomaly Detection (M2AD)
Creator: 华中科技大学智能制造装备与技术国家重点实验室, 密歇根大学机器人学系
Published: 2025-05-16 16:46:23
License: 暂无描述

arXiv2025-05-16 更新2025-05-20 收录

下载链接：

https://hustcyq.github.io/M2AD

下载链接

链接失效反馈

官方服务：

资源简介：

M2AD数据集是一个大规模的视觉异常检测数据集，由华中科技大学智能制造装备与技术国家重点实验室和密歇根大学机器人学系联合创建。该数据集包含119,880张高分辨率图像，旨在测试视觉异常检测系统在复杂视图-光照相互作用下的鲁棒性。数据集通过12个同步视图和10种照明设置（总共120种配置）系统地捕获了999个样本，覆盖了10个类别。M2AD数据集可用于开发和应用视觉异常检测系统，尤其是在工业质量控制、医学成像等领域。

The M2AD dataset is a large-scale visual anomaly detection dataset jointly developed by the State Key Laboratory of Intelligent Manufacturing Equipment and Technology at Huazhong University of Science and Technology and the Department of Robotics at the University of Michigan. It contains 119,880 high-resolution images, and is designed to evaluate the robustness of visual anomaly detection systems under complex view-light interactions. Specifically, the dataset systematically captures 999 samples across 10 categories, with data acquired via 12 synchronized views and 10 lighting settings, resulting in a total of 120 experimental configurations. The M2AD dataset can be utilized for developing and deploying visual anomaly detection systems, especially in domains such as industrial quality control and medical imaging.

提供机构：

华中科技大学智能制造装备与技术国家重点实验室, 密歇根大学机器人学系

创建时间：

2025-05-16

搜集汇总

数据集介绍

构建方式

M2AD数据集的构建采用了系统化的三阶段方法：首先，通过精心挑选20种物理对象，涵盖10个主要类别，每个类别包含两个子类别，以体现材料多样性（如粘土、塑料、木材等）和形状复杂性。其次，设计了一个可配置的成像原型，结合了高精度电机转台和可编程光源模块，实现了12个视角和10种光照条件的同步采集，每个样本共生成120种成像配置。最后，通过人工标注和基于Mask R-CNN的自动化检测一致性评估，筛选出具有可靠异常检测共识的样本，确保了数据质量。

使用方法

M2AD提供了两种标准化的评估协议：M2AD-Synergy评估方法利用样本全部120种成像配置进行信息融合，通过对象级（O-AUROC）和视角级（I-AUROC/AUPRO）指标衡量跨配置的异常检测能力；M2AD-Invariant则采用传统单图像评估范式，但测试集仅包含经严格筛选的可检测异常样本，用于评估方法在复杂成像噪声下的鲁棒性。研究者可选择256×256或512×512分辨率输入，通过官方提供的基准方法（如Dinomaly、INP-Former等）进行性能比对，实验配置需保持统一以确保证结果可比性。

背景与挑战

背景概述

MultiView Multi-Illumination Anomaly Detection (M2AD) 数据集由华中科技大学智能装备与技术国家重点实验室联合密歇根大学机器人系于2025年发布，旨在解决视觉异常检测（VAD）领域中视角与光照复杂交互影响的基准缺失问题。该数据集包含119,880张高分辨率图像，涵盖10个类别999个样本，通过12种同步视角和10种光照条件（共120种配置）的系统化采集，首次实现了对真实工业场景中多模态成像条件的建模。其创新性在于通过可控的几何-光度耦合实验设计，为研究视角不变性和光照鲁棒性提供了标准化评估平台，推动了缺陷检测技术从实验室向产线部署的转化。

当前挑战

M2AD面临的核心挑战体现在两个维度：在领域问题层面，现有VAD方法在复合视角-光照变化下的性能平均下降18.3%（如Dinomaly模型从MVTec AD的99.6% AUROC降至M2AD的81.3%），揭示了传统单模态检测范式对成像物理规律建模的不足；在构建层面，数据采集需解决120种配置的同步标定难题，包括亚毫米级转台精度控制、多光源光谱一致性保持，以及3,648×5,472像素图像中仅占0.05%面积的微缺陷的可检测性验证。此外，数据标注需通过Mask R-CNN三重交叉验证确保异常区域在特定光照-视角组合下的可辨识性，剔除IoU<0.3或置信度p<0.5的模糊样本，这种严苛的质量控制使约25%异常样本被排除。

常用场景

经典使用场景

在工业质量控制和医学影像分析领域，视觉异常检测（VAD）系统面临着复杂视角和光照条件交互影响的挑战。M2AD数据集通过系统性地捕捉12种同步视角和10种光照条件下的图像，为研究者在多视角多光照环境下进行异常检测提供了标准化的测试平台。该数据集最经典的使用场景包括评估算法在不同视角和光照组合下的鲁棒性，以及验证多模态信息融合策略的有效性。

解决学术问题

M2AD数据集解决了当前视觉异常检测研究中两个关键学术问题：一是现有基准数据集未能充分模拟真实世界中视角与光照的复杂交互效应，导致算法在实际应用中性能下降；二是缺乏系统性的评估框架来衡量算法对成像条件变化的鲁棒性。通过提供119,880张高分辨率图像和两种评估协议（M2AD-Synergy和M2AD-Invariant），该数据集为开发具有真实世界适应性的VAD方法提供了重要基础。

实际应用

在实际应用层面，M2AD数据集可直接服务于智能制造中的自动光学检测系统。其多视角多光照的设计特性特别适用于需要检测表面细微缺陷的工业场景，如电子产品外壳的划痕检测、汽车零部件的表面质量检查等。数据集包含的10个物体类别和20个子类别，覆盖了从塑料到金属等多种材料，使其能够支持跨行业的质量控制应用开发。

数据集最近研究