five

Surface Defect Detection Datasets(SDDDs)|工业缺陷检测数据集|机器视觉数据集

收藏
github2023-04-12 更新2024-05-31 收录
工业缺陷检测
机器视觉
下载链接:
https://github.com/Woody-Tang/surface_defect_detection_datasets
下载链接
链接失效反馈
资源简介:
本仓库收集各种缺陷检测数据集,重点聚焦工业产品表面缺陷数据集。工业缺陷检测重点项目中,对工业缺陷进行二次可信检测需要2D工业产品缺陷数据集来进行实验。

This repository collects various defect detection datasets, with a particular focus on datasets related to surface defects in industrial products. In key projects of industrial defect detection, conducting secondary reliable detection of industrial defects requires 2D industrial product defect datasets for experimentation.
创建时间:
2023-04-12
原始信息汇总

Surface Defect Detection Datasets(SDDDs)

本数据集仓库专注于收集工业产品表面缺陷数据集,主要用于工业缺陷的二次可信检测实验。以下是收集的数据集列表:

  1. 弱监督学习下的工业光学检测

    • 数据集名称:Weakly Supervised Learning for Industrial Optical Inspection
    • 数据集链接:DAGM2007
  2. 金属表面缺陷数据集

    • 数据集名称:Kolektor Surface-Defect Dataset
    • 数据集链接:KolektorSDD
  3. 金属表面缺陷数据集2

    • 数据集名称:Kolektor Surface-Defect Dataset 2
    • 数据集链接:KolektorSDD2
  4. 磁瓦缺陷数据集

  5. 工业缺陷检测数据集

    • 数据集名称:MVTEC ANOMALY DETECTION DATASET
    • 数据集链接:MVTecAD
  6. 东北大学钢材表面数据集

  7. 基建表面裂纹检测数据

每个数据集的详细描述、相关论文、代码以及展示图片(如有)均位于各自文件夹下的description.txt文件中。

AI搜集汇总
数据集介绍
main_image_url
构建方式
Surface Defect Detection Datasets(SDDDs)的构建依托于多个公开的工业产品表面缺陷数据集,涵盖了从金属表面到磁瓦、基建表面等多种材料的缺陷检测。每个数据集均通过高精度的工业光学检测设备采集,确保图像质量与缺陷特征的清晰度。数据集的构建过程中,特别注重缺陷类型的多样性与实际工业场景的贴合度,涵盖了裂纹、划痕、凹坑等多种常见缺陷类型。此外,部分数据集还引入了弱监督学习方法,以应对工业检测中标注数据稀缺的挑战。
特点
SDDDs的核心特点在于其广泛的应用场景与高质量的图像数据。数据集不仅覆盖了金属、磁瓦、基建等多种工业材料,还提供了多样化的缺陷类型,能够满足不同工业检测任务的需求。数据集中的图像分辨率高,缺陷特征明显,便于算法模型的训练与验证。同时,部分数据集还提供了弱监督学习的标注方式,为研究者在有限标注数据下的模型训练提供了便利。此外,每个数据集均附带了详细的描述文件、相关论文及代码,为研究者提供了全面的技术支持。
使用方法
SDDDs的使用方法灵活多样,适用于多种工业缺陷检测任务。研究者可以根据具体需求选择相应的数据集进行实验。每个数据集文件夹下均包含详细的描述文件(description.txt),提供了数据集的背景信息、缺陷类型及标注方式。此外,数据集还附带了相关论文与代码,便于研究者快速复现实验或进行二次开发。对于弱监督学习任务,研究者可以利用提供的弱标注数据进行模型训练与验证。数据集的高质量图像与多样化缺陷类型,使其成为工业缺陷检测算法开发与性能评估的理想选择。
背景与挑战
背景概述
Surface Defect Detection Datasets(SDDDs)是一个专注于工业产品表面缺陷检测的数据集集合,旨在为工业缺陷检测领域提供高质量的数据支持。该数据集由多个子数据集组成,涵盖了金属表面、磁瓦、钢材等多种材料的缺陷检测任务。SDDDs的创建时间可追溯至2007年,最早的数据集DAGM2007便是在此期间发布,后续数据集如KolektorSDD、MVTecAD等也陆续加入,形成了较为完整的工业缺陷检测数据集体系。这些数据集由多个研究机构和企业共同开发,包括Kolektor公司、MVTec公司以及东北大学等。SDDDs的核心研究问题在于如何通过机器视觉技术实现对工业产品表面缺陷的自动化检测,从而提升生产效率和产品质量。该数据集在工业缺陷检测领域具有广泛的影响力,为学术界和工业界提供了重要的实验数据基础。
当前挑战
SDDDs所解决的领域问题主要集中在工业产品表面缺陷的自动化检测上,这一任务面临诸多挑战。首先,工业缺陷的多样性和复杂性使得数据标注和模型训练变得极为困难,尤其是弱监督学习场景下,如何利用有限的标注数据进行高效训练是一个关键问题。其次,不同材料表面的缺陷特征差异较大,单一模型难以适应多种材料的检测需求,这对模型的泛化能力提出了较高要求。在数据集构建过程中,挑战同样显著。工业环境的复杂性和数据采集设备的限制导致数据质量参差不齐,如何确保数据的准确性和一致性是构建过程中的一大难题。此外,数据集的多样性和规模也对存储和计算资源提出了较高要求,如何在有限资源下高效管理和处理大规模数据是另一个亟待解决的问题。
常用场景
经典使用场景
在工业制造领域,Surface Defect Detection Datasets (SDDDs) 被广泛应用于表面缺陷检测任务。这些数据集通过提供多样化的工业产品表面缺陷图像,支持研究人员开发和验证缺陷检测算法。例如,DAGM2007 数据集常用于弱监督学习算法的实验,而 KolektorSDD 和 KolektorSDD2 数据集则用于金属表面缺陷的检测与分类。这些数据集的使用场景涵盖了从光学检测到自动化质量控制的全流程。
衍生相关工作
SDDDs 的发布催生了一系列经典研究工作。例如,基于 DAGM2007 数据集的研究提出了多种弱监督学习算法,显著提升了缺陷检测的精度。KolektorSDD 数据集则激发了金属表面缺陷检测领域的新方法,如基于深度学习的多尺度特征融合技术。此外,MVTecAD 数据集推动了异常检测算法的创新,相关研究成果已被广泛应用于工业实践。这些衍生工作进一步拓展了缺陷检测技术的边界。
数据集最近研究
最新研究方向
在工业表面缺陷检测领域,Surface Defect Detection Datasets (SDDDs) 的引入为研究者提供了丰富的实验数据,推动了该领域的技术进步。近年来,随着深度学习技术的快速发展,基于SDDDs的研究主要集中在弱监督学习和自动化缺陷检测系统的开发上。例如,利用DAGM2007数据集,研究者探索了在有限标注数据下的高效缺陷识别方法,这对于降低工业检测成本具有重要意义。同时,KolektorSDD和KolektorSDD2数据集的应用,使得金属表面缺陷的检测精度得到了显著提升。此外,MVTecAD数据集的使用,促进了异常检测算法的发展,特别是在复杂工业环境中的应用。这些研究不仅提高了工业生产的自动化水平,也为相关领域的技术创新提供了坚实的数据支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

TCIA: The Cancer Imaging Archive

TCIA: The Cancer Imaging Archive 是一个公开的癌症影像数据库,包含多种癌症类型的影像数据,如乳腺癌、肺癌、脑癌等。数据集还包括相关的临床数据和生物标记物信息,旨在支持癌症研究和临床应用。

www.cancerimagingarchive.net 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录