five

M2AD

收藏
github2025-05-19 更新2025-05-20 收录
下载链接:
https://github.com/hustCYQ/M2AD
下载链接
链接失效反馈
官方服务:
资源简介:
M2AD是一个大规模视觉异常检测基准数据集,专注于复杂视角和光照条件下的异常检测。

M2AD is a large-scale visual anomaly detection benchmark dataset focused on anomaly detection under complex viewing angles and lighting conditions.
创建时间:
2025-04-28
原始信息汇总

M2AD数据集概述

基本信息

  • 数据集名称: Visual Anomaly Detection under Complex View-Illumination Interplay: A Large-Scale Benchmark
  • 论文链接: arXiv论文
  • 主页链接: M2AD数据集主页
  • 作者:
    • Yunkang Cao
    • Yuqi Cheng
    • Xiaohao Xu
    • Yiheng Zhang
    • Yihan Sun
    • Yuxiang Tan
    • Yuxin Zhang
    • Weiming Shen

数据集更新

  • 2025/05/19: 论文发布于arXiv
  • 2025/05/16: 数据集主页发布

数据集准备

  • 下载链接:

  • 数据结构示例:

    M2AD_1024 ├── Bird ├── Good ├── 000 ├── 001 ... ├── GT ├── damage_1_001 ├── damage_1_002 ... ├── NG ├── damage_1_001 ├── damage_1_002 ... ├── Car ...

训练与测试

  • 支持的SOTA方法:
    • CDO
    • Dinomaly
    • InpFormer
    • MSFlow
    • RD++
  • 运行示例: shell python run_dataset.py -c configs/benchmark/cdo/cdo_100e.py python run_dataset.py -c configs/benchmark/dinomaly/dinomaly_100e.py python run_dataset.py -c configs/benchmark/inpformer/inpformer_100e.py python run_dataset.py -c configs/benchmark/msflow/msflow_100e.py python run_dataset.py -c configs/benchmark/rdpp/rdpp_256_100e.py

主要结果

  • M2AD 256x256结果: 见数据集主页
  • M2AD 512x512结果: 见数据集主页
搜集汇总
数据集介绍
main_image_url
构建方式
在工业视觉检测领域,复杂视角与光照条件下的异常检测一直面临重大挑战。M2AD数据集通过精心设计的采集方案构建而成,采用多视角投影技术将三维点云数据转化为二维深度图像,涵盖10个不同工业品类的样本数据。数据采集过程中严格模拟了真实工业环境下的多光照条件与多视角变化,确保数据集能够全面反映实际检测场景中的复杂视觉特征。
特点
该数据集最显著的特点在于其规模化的多模态数据构成,包含256x256和512x512两种分辨率版本,每个样本均配备正常样本、缺陷样本及对应的标注掩膜。数据集特别注重视角与光照的交互影响,通过系统性的变量控制构建了丰富的视觉变化场景。其独特的深度图像表示形式,为研究视觉语言模型在工业异常检测中的迁移学习能力提供了理想平台。
使用方法
使用该数据集需先配置专用实验环境,包括特定版本的Python库和深度学习框架。数据集支持多种主流异常检测算法的直接调用,用户可通过修改配置文件快速复现基准实验结果。数据处理流程包含元数据生成、训练测试集划分等标准化步骤,研究者既可下载预处理好的数据直接使用,也可根据需求重新生成数据分布。为便于算法验证,数据集已内置五种先进方法的实现代码与评估指标。
背景与挑战
背景概述
M2AD数据集由华中科技大学的研究团队于2025年5月正式发布,旨在解决复杂视角与光照条件下视觉异常检测的核心问题。该数据集作为大规模基准测试平台,通过多视角深度图像投影技术,将三维点云异常检测转化为二维图像分析任务,显著提升了工业质检领域的泛化能力。研究团队创新性地融合了视觉语言模型的零样本学习能力,并引入可学习的视觉与文本提示技术,在MVTec 3D-AD等标准测试集上实现了突破性性能。该数据集的发布为跨产品类别的缺陷检测提供了新的研究范式,推动了计算机视觉与工业智能质检的交叉发展。
当前挑战
在解决工业异常检测问题时,M2AD面临三大核心挑战:传统无监督方法难以应对早期生产阶段的数据稀缺性,不同产品类别间的特征漂移导致模型泛化能力受限,以及复杂视角与光照变化对检测稳定性的干扰。数据集构建过程中,研究团队需攻克多模态数据对齐的技术瓶颈,包括点云到多视角深度图像的精确投影转换、跨设备采集的光照条件标准化,以及工业场景下细微缺陷的标注一致性保障。这些挑战既反映了真实工业环境的复杂性,也推动了视觉异常检测方法在鲁棒性与适应性方面的理论创新。
常用场景
经典使用场景
在工业质检领域,M2AD数据集通过多视角、多光照条件下的视觉异常检测,为复杂环境下的产品缺陷识别提供了标准化的评估基准。其深度图像投影技术将点云数据转化为二维图像,使得传统基于图像的异常检测算法能够直接应用于三维物体表面缺陷检测,显著降低了工业质检场景中数据采集和处理的复杂度。
实际应用
在汽车零部件塑料件检测等实际工业场景中,M2AD的深度图像转换技术显著降低了三维扫描设备的依赖。制造企业可通过普通工业相机采集二维图像,利用该数据集训练的模型实现高精度缺陷检测,这种方案在早期生产阶段和中小规模产线中展现出显著的成本优势。
衍生相关工作
基于M2AD的MVP框架催生了多个创新研究方向,包括动态光照条件下的异常检测算法优化、跨模态的视觉-语言提示微调技术等。其基准测试结果直接推动了CDO、Dinomaly等算法在工业场景的改进,相关衍生工作已在IEEE Transactions on Industrial Informatics等期刊形成系列研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作