five

custom dataset

收藏
github2024-05-06 更新2024-05-31 收录
下载链接:
https://github.com/enrico310786/Image_Anomaly_Detection
下载链接
链接失效反馈
官方服务:
资源简介:
通过简化一个真实的工业项目规范,构建了一个玩具自定义数据集。问题是在每个步骤结束时,验证组件的排列是否符合预期。为了简化,使用了一个木箱和四个矩形乐高块,通过旋转这些块来模拟不同的排列。数据集中的每张图片都有一个特定的排列状态,任何不符合正确排列的图片都被视为异常。

By simplifying a real industrial project specification, a toy custom dataset was constructed. The problem is to verify whether the arrangement of components meets expectations at the end of each step. For simplification, a wooden box and four rectangular LEGO blocks were used, and these blocks were rotated to simulate different arrangements. Each image in the dataset has a specific arrangement state, and any image that does not conform to the correct arrangement is considered an anomaly.
创建时间:
2024-03-22
原始信息汇总

数据集概述

数据集名称

  • 名称: Image_Anomaly_Detection

数据集描述

  • 目的: 用于检测工业机器组件在执行一系列动作后的正确排列,识别异常配置。
  • 构建方法: 使用木箱和四个矩形乐高块模拟工业机器组件,通过改变乐高块的排列来创建正常和异常图像。
  • 图像处理: 所有图像大小为256x256像素。

数据集结构

  • 类别:
    • one_up
    • two_up
    • three_up
    • four_up
  • 图像数量:
    • 每个类别下有多个子类别,包括正常(90_DEG)和异常(60_DEG, 45_DEG, 30_DEG)状态。
    • 例如,在one_up类别中,正常图像有3638张,异常图像分别为955、967、965张。

数据集下载

数据管理

数据模块配置

  • 数据结构: 遵循特定文件夹结构,包括正常和异常图像的存储目录。
  • 数据分割: 使用CLASSIFICATION任务类型,根据设置的参数(如normal_split_ratio, val_split_mode等)进行训练、验证和测试集的划分。
  • 图像处理: 图像自动转换为torch张量,并进行归一化处理。

模型训练与测试

可用模型

  • 模型列表: 包括Patchcore, EfficientAD, ReverseDistillation, FastFlow, Padim等。
  • 训练脚本: 提供特定脚本来训练不同模型,如train_patchcore_anomalib.py, train_efficientAD_anomalib.py等。
  • 测试脚本: 使用test_model.py脚本进行模型测试,生成混淆矩阵和分类得分分布。

模型推理

  • 推理功能: 使用TorchInferencer对象加载模型权重,进行单张图像的预测,输出包括预测标签、得分、热图等信息。
  • 推理脚本: 使用infer_oneshot.py脚本进行单张图像的推理。

应用展示

Gradio应用

  • 应用描述: 使用Gradio构建的简单Web应用,用于展示模型的实时推理结果。
  • 启动脚本: 使用app.py脚本启动Gradio应用。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过简化一个真实的工业项目构建而成,旨在模拟工业机器中组件排列的验证任务。具体而言,数据集基于一个木盒和四个矩形乐高积木,通过旋转这些积木来模拟不同的排列状态。初始配置为所有积木水平排列,随后通过逐步旋转积木,生成一系列正确的最终状态图像。每一步的错误排列被视为异常,从而构建了包含正常和异常图像的分类数据集。
使用方法
使用该数据集时,首先需按照指定的文件夹结构组织数据,并利用Anomalib库中的Folder类进行数据加载和分割。通过设置相关参数,如训练集、验证集和测试集的比例,用户可以轻松管理数据。随后,可以选择多种预训练模型(如Patchcore, EfficientAD等)进行训练和测试,并通过保存的最佳模型权重进行推理。此外,数据集还支持通过Gradio构建的Web应用进行实时推理演示。
背景与挑战
背景概述
Custom Dataset 是一个用于图像异常检测的研究数据集,由研究人员通过简化真实工业项目的规范构建而成。该数据集的核心研究问题在于验证工业机器在执行一系列操作后,其组件的排列是否符合预期。通过使用Anomalib库,研究人员能够微调预训练模型,并测试其在识别异常图像及定位异常区域方面的能力。数据集的创建旨在模拟工业环境中的实际问题,通过图像分类和异常检测技术,帮助识别和定位操作错误。该数据集的构建不仅为图像异常检测领域提供了新的研究素材,也为工业自动化和质量控制提供了潜在的应用价值。
当前挑战
Custom Dataset 在构建过程中面临了多个挑战。首先,数据集的创建需要模拟复杂的工业环境,确保图像数据的真实性和多样性,这要求研究人员在数据采集和标注过程中保持高度的准确性。其次,异常检测模型的训练和测试需要处理大量的图像数据,如何在有限的计算资源下高效地进行模型训练和验证是一个技术难题。此外,由于异常情况的多样性,模型需要具备较高的泛化能力,以应对不同类型的异常图像。最后,数据集的结构和标注方式需要与Anomalib库的API兼容,确保数据能够顺利加载和处理,这也是一个技术实现的挑战。
常用场景
经典使用场景
在图像异常检测领域,该数据集的经典使用场景主要集中在工业自动化中的组件状态验证。通过模拟工业机器中组件的旋转操作,数据集提供了正常和异常配置的图像,使得研究人员能够训练和测试模型,以识别和定位异常组件。这种场景特别适用于需要高精度检测的工业环境,如生产线上的质量控制。
解决学术问题
该数据集解决了图像异常检测中的关键学术问题,即如何在复杂工业环境中准确识别和定位异常。通过提供详细的正常和异常图像数据,研究人员可以开发和验证新的算法,以提高异常检测的精度和效率。这不仅推动了图像处理技术的发展,还为工业自动化领域的研究提供了宝贵的资源。
实际应用
在实际应用中,该数据集可用于开发和部署工业自动化系统中的异常检测模块。例如,在汽车制造或电子产品装配线上,系统可以实时监控组件的排列状态,自动识别并报告任何异常,从而提高生产效率和产品质量。此外,该数据集还可用于培训操作人员,帮助他们快速识别和处理生产过程中的问题。
数据集最近研究
最新研究方向
在图像异常检测领域,custom dataset的最新研究方向主要集中在利用Anomalib库对预训练模型进行微调,以提升模型在工业场景中的异常检测和定位能力。该数据集通过模拟工业机器组件的排列变化,构建了一个包含正常和异常配置的图像数据集,旨在验证模型在不同旋转角度下的识别准确性。前沿研究不仅关注模型的分类性能,还着重于异常区域的精确定位,尤其是在复杂工业环境中的应用。此外,研究还涉及多种深度学习模型的比较,如Patchcore、EfficientAD和ReverseDistillation等,以探索最优的异常检测策略。这些研究不仅推动了图像异常检测技术的发展,也为工业自动化和质量控制提供了重要的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作