ReinAD
收藏Hugging Face2025-10-24 更新2025-10-25 收录
下载链接:
https://huggingface.co/datasets/Tocmac/ReinAD
下载链接
链接失效反馈官方服务:
资源简介:
ReinAD数据集是一个用于真实世界工业异常检测的全面对比数据集,包含训练集和测试集。所有正常和异常图像都存储为hdf5格式,并包含像素级注释来区分正常和异常区域。数据集的文件结构包括多个类别的hdf5文件,每个文件中包含异常图像和正常图像以及对应的遮罩。
The ReinAD dataset is a comprehensive comparative dataset for real-world industrial anomaly detection, comprising both training and test sets. All normal and anomalous images are stored in HDF5 format, with pixel-level annotations provided to distinguish between normal and anomalous regions. The file structure of the dataset includes multiple categorized HDF5 files, each containing abnormal images, normal images, and their corresponding masks.
创建时间:
2025-10-22
原始信息汇总
ReinAD数据集概述
基本信息
- 许可证: CC-BY-NC-SA-4.0
- 语言: 英语
- 数据规模: 100B<n<1T
数据集描述
ReinAD是一个面向真实世界工业异常检测的综合对比数据集,包含训练集和测试集。
数据格式
- 所有正常和异常图像均采用HDF5格式存储
- 掩码标注中:0值像素代表正常区域,1值像素代表异常区域
文件结构
dataset/ ├── train/ │ ├── category1.h5 │ ├── category2.h5 │ └── ... │ └── test/ ├── category1.h5 ├── category2.h5 └── ...
HDF5文件结构
-
根目录属性:
- split: "train"/"test"
- category: 类别名称
-
图像数据:
- Anomaly_X: [chunk_size, H, W, C] - 异常图像
- Normal_X: [chunk_size, H, W, C] - 正常图像
- chunk_size = 100
-
掩码数据:
- Anomaly_X: [chunk_size, H, W] - 异常图像的像素级标注
搜集汇总
数据集介绍

构建方式
在工业异常检测领域,ReinAD数据集通过系统化的数据采集与标注流程构建而成。该数据集采用分块存储的HDF5格式,将训练集与测试集按类别分层组织,每个类别文件包含以100张图像为单位的块状数据。正常样本与异常样本分别存储于Images组内,并配备像素级掩码标注,其中Masks组以二进制值精确标记异常区域,确保了数据结构的规范性与可扩展性。
使用方法
针对工业异常检测任务的应用需求,使用者可通过解析HDF5文件层级结构直接访问数据。训练阶段可调用Images组中的Normal系列数据构建正常样本特征空间,测试阶段则结合Anomaly图像与对应Masks实现异常定位验证。数据按类别独立存储的特性支持跨类别迁移学习研究,而统一的分块格式便于流式加载与分布式训练,显著提升算法开发效率。
背景与挑战
背景概述
工业异常检测作为智能制造领域的关键技术,旨在通过计算机视觉手段自动识别生产流程中的产品缺陷。ReinAD数据集由研究团队于2023年构建,其核心目标在于填补现实工业场景中高质量标注数据的空白。该数据集通过系统化采集涵盖多类工业产品的正常与异常样本,为无监督与半监督异常检测算法提供了标准化评估基准,显著推动了智能制造质量管控体系的技术演进。
当前挑战
工业异常检测面临小样本学习的根本性难题,由于实际生产中异常样本稀缺且形态多变,传统监督学习方法难以实现有效泛化。在数据集构建过程中,团队需克服多维度挑战:既要保证高分辨率图像采集的环境一致性,又需专家团队对像素级掩码标注进行交叉验证。数据存储方面采用分块压缩的HDF5格式,以平衡大规模图像数据存取效率与存储成本之间的矛盾。
常用场景
经典使用场景
在工业视觉检测领域,ReinAD数据集为异常检测算法提供了标准化评估基准。该数据集通过包含多类别正常与异常图像的对比结构,支持监督式与半监督式学习范式的开发。研究者可基于其像素级掩码标注,系统验证模型在复杂工业场景下的分类精度与定位能力,推动检测方法从理论验证向实际部署过渡。
解决学术问题
该数据集有效缓解了工业异常检测领域标注数据稀缺的瓶颈问题。其大规模高质量像素级标注突破了传统方法对合成数据的依赖,为研究真实场景下的细粒度异常模式提供了数据基础。通过构建多维度异常类型与正常样本的对比关系,显著提升了模型对未知异常的泛化能力,推动了小样本异常检测理论的发展。
实际应用
在智能制造体系中,ReinAD支撑的检测模型已应用于精密元器件质检、生产线故障诊断等场景。基于其多类别工业图像构建的检测系统,能够实时识别产品表面缺陷与装配异常,显著降低人工质检成本。其标准化数据格式更便于集成到工业视觉平台,为自动化质量控制系统提供核心算法支持。
数据集最近研究
最新研究方向
在工业视觉异常检测领域,ReinAD数据集凭借其海量真实场景样本与像素级标注优势,正推动弱监督异常定位技术的突破性进展。研究者们聚焦于构建多尺度特征对比框架,通过解构正常与异常样本的潜在表征差异,显著提升了细微缺陷的识别灵敏度。该数据集进一步催化了自监督预训练与元学习范式的融合创新,使模型在少样本条件下仍能保持稳定的泛化性能。随着智能制造对检测精度要求的不断提升,基于ReinAD的跨域自适应研究已成为行业热点,其提供的标准化评估基准正重塑着工业质量控制的技术路径。
以上内容由遇见数据集搜集并总结生成



