MIRAD

Name: MIRAD
Creator: 郑州大学管理系, 香港大学数据与系统工程系, 国防科技大学智能科学与技术学院
Published: 2025-10-18 14:39:45
License: 暂无描述

arXiv2025-10-18 更新2025-10-22 收录

下载链接：

https://github.com/wu33learn/MIRAD

下载链接

链接失效反馈

官方服务：

资源简介：

MIRAD数据集是一个专门为社交制造中的大规模个性化异常检测设计的基准数据集。该数据集收集了来自六个地理上分散的制造节点的数据，并涵盖了包括光照、背景和运动条件在内的实质性成像异质性。MIRAD捕捉了社交制造领域的三个关键维度：具有大量类内变化的多样化个性化产品、来自六个地理分散的制造节点的数据收集以及成像异质性。

The MIRAD dataset is a benchmark dataset specifically designed for large-scale personalized anomaly detection in social manufacturing. This dataset collects data from six geographically dispersed manufacturing nodes and covers substantial imaging heterogeneity including lighting, background, and motion conditions. The MIRAD dataset captures three key dimensions of the social manufacturing domain: diversified personalized products with significant intra-class variations, data collection from six geographically dispersed manufacturing nodes, and imaging heterogeneity.

提供机构：

郑州大学管理系, 香港大学数据与系统工程系, 国防科技大学智能科学与技术学院

创建时间：

2025-10-18

原始信息汇总

MIRAD数据集概述

数据集简介

MIRAD是一个面向大规模个性化生产的综合真实世界鲁棒异常检测数据集。该数据集代表了连接单类和多类异常检测范式的混合场景。

数据描述

产品类别

包含10类个性化产品
涵盖三种设计范式：
- 几何复杂组件（几何积木、按钮）
- 数字和符号编码项目（带阿拉伯数字的数字积木、数学符号）
- 风格化工艺品（兔子挂件、磁性书签）

数据规模

2398张无缺陷训练图像
2391个测试样本
1737张测试图像包含像素级标注的缺陷

特性

包含多目标检测场景，单个帧中存在两个或多个个性化产品
分布式生产节点采用不同的运动和照明策略
使用不同的相机规格
具有节点特定的背景
涵盖表面缺陷和逻辑缺陷

数据下载

数据集可通过以下链接下载：https://drive.google.com/file/d/1-4aMEtiTvk77Oo-oNW6WdPPuxpfHRKwq/view?usp=sharing

数据目录结构

MIRAD |-- building_block |-----|--- train |-----|-----|----- good |-----|--- test |-----|-----|----- good |-----|-----|----- anomaly |-----|--- ground_truth |-- chain_buckle |-----|----- ...

实验结果

单类和多类方法

单类方法在MIRAD上仅达到76.2% I-AUROC
多类方法得分更低，为71.1% I-AUROC
相比之下，在MVTec AD上达到约98%，在VisA上达到约93%

零样本方法

AnomalyCLIP和AdaCLIP在MIRAD基准测试中表现不佳
从传统数据集学习的统一表示难以泛化到MIRAD

许可证

数据基于CC BY 4.0许可证发布。

搜集汇总

数据集介绍

构建方式

在智能制造领域，MIRAD数据集通过整合社会制造网络中的分布式生产节点构建而成，覆盖了六个地理分散的制造车间，采集了10类个性化产品的图像数据。数据采集过程模拟了真实生产环境中的混合流制造模式，其中超过30%的图像包含多个共存产品，反映了小批量、高定制化的生产特点。数据集包含2398张正常训练图像和2391张测试样本，其中1737张测试图像标注了像素级缺陷，涵盖了63种缺陷类型，包括表面瑕疵和逻辑异常。

使用方法

该数据集支持三类异常检测范式的评估：单类别方法针对特定产品类别建立独立检测模型，多类别方法采用统一框架处理跨类别检测任务，零样本方法则利用预训练视觉语言模型实现无需目标数据训练的冷启动检测。评估时需将图像统一缩放至256×256像素，采用图像级AUROC和像素级AUPRO作为核心指标。通过这种分层评估结构，研究者能够系统检验模型在个性化生产场景中的泛化能力和鲁棒性，为开发适应社会制造需求的质控解决方案提供实证基础。

背景与挑战

背景概述

随着工业5.0时代的到来，社会制造模式通过社区协作与分布式资源整合，实现了大规模个性化生产的转型。由郑州大学与香港大学等机构联合开发的MIRAD数据集，作为首个面向社会制造场景的异常检测基准，于2024年正式发布。该数据集聚焦于个性化生产环境下的质量控制难题，通过采集来自六个分布式制造节点的4789张图像，涵盖几何构件、数字符号制品等十类个性化产品，有效填补了传统数据集在类内多样性与环境异质性建模方面的空白。其创新性架构为研究界提供了模拟真实分布式制造网络的实验平台，推动了智能制造质量监控技术的范式演进。

当前挑战

MIRAD数据集致力于解决个性化生产场景中缺陷检测的核心挑战：其一，在领域问题层面，高度定制化产品导致正常样本与缺陷特征边界模糊，传统单类别检测模型面临跨类别特征干扰与半开放集识别困境；其二，在构建过程中需克服多节点数据采集的复杂性，包括分布式车间光照条件、运动模式与成像配置的显著差异，以及混合流水线生产中多产品共现图像的标注难题。这些因素共同导致现有先进模型在MIRAD上的性能较传统基准下降超20%，凸显了开发适应个性化生产特性的专用算法的迫切性。

常用场景

经典使用场景

在智能制造与工业5.0的背景下，MIRAD数据集作为首个面向社会化制造场景的异常检测基准，其经典应用聚焦于高度定制化产品的质量监控。该数据集通过整合分布式制造节点中采集的多样化产品图像，涵盖几何组件、符号化设计及风格化工艺品等十类个性化商品，为模型训练提供了丰富的类内差异样本。其混合生产流程与多目标共现的成像特性，使得研究者能够评估算法在真实工业环境中对结构性与逻辑性缺陷的识别能力，尤其适用于模拟小批量、多配置订单的柔性生产线质量控制需求。

解决学术问题

MIRAD数据集有效解决了传统异常检测研究在个性化生产场景中的适应性瓶颈。现有基准如MVTec AD多基于标准化产线构建，缺乏对产品类内多样性及环境异构性的建模。MIRAD通过引入六地制造节点的成像差异（如光照波动、运动模糊、背景复杂度），揭示了算法在跨节点泛化中的性能衰减现象。该数据集为单类、多类及零样本异常检测方法提供了过渡性验证场景，推动学界探索如何在保留类别共性的同时建模个体化特征，进而弥合理论模型与工业实践间的鸿沟。

实际应用

在实际工业场景中，MIRAD数据集为分布式制造网络的质量控制提供了关键支撑。其多节点采集策略模拟了鞋履、灯具等行业的个性化定制产线，其中超30%图像包含共现的定制产品，精准还原了混合流生产的视觉特性。通过嵌入复合运动、自由视角及动态分辨率等真实成像条件，该数据集助力开发具备环境鲁棒性的检测系统，可应用于智能质检设备动态适配产线配置变更、跨工厂模型迁移等场景，显著提升个性化生产中的缺陷拦截效率与资源利用率。

数据集最近研究