five

NEU Surface Defect Database|表面缺陷检测数据集|工业检测数据集

收藏
github2024-08-17 更新2024-08-18 收录
表面缺陷检测
工业检测
下载链接:
https://github.com/Yakhyobek1997/Surface-Flaw-Detection-in-Steel-Dataset
下载链接
链接失效反馈
资源简介:
NEU Surface Defect Database包含六种常见的热轧钢带表面缺陷类型:滚入式刻度(RS)、斑块(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc)。所有图像均为灰度图像,分辨率为200x200像素,数据库包含1800张图像,每种缺陷类型有300个样本。
创建时间:
2024-08-17
原始信息汇总

数据集概述

数据集名称

NEU Surface Defect Database

数据集描述

该数据集包含六种常见的热轧钢带表面缺陷类型:

  • 轧入氧化皮(RS)
  • 斑块(Pa)
  • 裂纹(Cr)
  • 麻点表面(PS)
  • 夹杂物(In)
  • 划痕(Sc)

所有图像均为灰度图像,分辨率为200x200像素。数据集共包含1,800张图像,每种缺陷类型有300个样本。

数据集结构

  • ANNOTATIONS: 包含缺陷位置标注的XML文件。
  • IMAGES: 用于训练的原始钢表面图像。
  • Validation_Annotations: 用于最终验证的图像标注。
  • Validation_Images: 用于最终验证的图像。
  • Models: 存储训练好的模型文件(.pth格式)。
  • Utilities: 包含模型训练、评估和推理的实用脚本。

关键脚本

  • Meter.py: 包含计算评估指标(如IOU、Dice系数)的逻辑。
  • Trainer.py: 管理模型训练过程。
  • Data_Retriever_Seg.py: 处理训练和测试的数据加载。
  • Resnet_Unet.py: 定义带有ResNet编码器的U-Net模型架构。
  • Create_Validation_Images.ipynb: 用于分离验证图像的脚本。
  • Exploratory_Data_Analysis.ipynb: 提供初始数据分析。
  • Train_Segmentation_Model: 用于训练不同分割模型的脚本。
  • Inference_Script.ipynb: 用于生成分割掩码的推理脚本。
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建NEU Surface Defect Database时,东北大学(NEU)精心收集并分类了六种常见的钢板表面缺陷,包括Rolled-in scale (RS)、Patches (Pa)、Crazing (Cr)、Pitted surface (PS)、Inclusion (In)和Scratches (Sc)。每种缺陷类型均包含300张灰度图像,分辨率为200x200像素,总计1800张图像。数据集的构建过程中,采用了随机抽样的方法,从每种缺陷类型中选取五张图像用于验证集,确保训练集与验证集的独立性。
特点
NEU Surface Defect Database的显著特点在于其高度的专业性和实用性。首先,该数据集涵盖了六种常见的钢板表面缺陷,为研究者提供了丰富的样本资源。其次,所有图像均为灰度格式,分辨率统一为200x200像素,确保了数据的一致性和可比性。此外,数据集的结构设计合理,包含训练集、验证集和测试集,便于模型训练和性能评估。
使用方法
使用NEU Surface Defect Database进行研究时,首先需将数据集划分为训练集和验证集。随后,可利用提供的脚本如Create_Validation_Images.ipynb进行数据预处理。在模型训练阶段,可选择U-Net架构结合ResNet34编码器,或尝试其他如FPN结合InceptionV4编码器的架构。训练过程中,通过Train_Segmentation_Model脚本启动训练,并利用Trainer.py和Data_Retriever_Seg.py进行模型管理和数据加载。训练完成后,使用Inference_Script.ipynb进行推理,生成并评估分割掩码。
背景与挑战
背景概述
近年来,钢铁工业的自动化和智能化进程加速,表面缺陷检测作为关键环节,其准确性和效率直接影响产品质量和生产成本。东北大学(NEU)推出的NEU Surface Defect Database,旨在为钢铁表面缺陷检测提供一个标准化的数据集,推动相关算法的研究与应用。该数据集收录了六种常见的热轧钢带表面缺陷,包括卷入尺度(RS)、斑块(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc),共计1800张200x200像素的灰度图像。这一数据集的发布,不仅为学术界提供了丰富的研究素材,也为工业界实现高效、精准的缺陷检测提供了技术支持。
当前挑战
尽管NEU Surface Defect Database为钢铁表面缺陷检测提供了宝贵的数据资源,但在实际应用中仍面临诸多挑战。首先,数据集中的缺陷类型多样且复杂,如何设计有效的特征提取和分类算法,以提高检测精度,是一个亟待解决的问题。其次,数据集的规模相对有限,如何在有限的样本中实现模型的泛化能力,避免过拟合,是另一个重要挑战。此外,数据集的构建过程中,图像的标注和分割工作量大且复杂,如何提高标注的准确性和效率,也是未来研究需要关注的问题。
常用场景
经典使用场景
在钢铁工业领域,NEU Surface Defect Database 数据集被广泛应用于表面缺陷检测。该数据集通过提供六种常见的热轧钢带表面缺陷图像,包括卷入的鳞片(RS)、斑点(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc),为研究人员和工程师提供了一个标准化的测试平台。这些图像均为200x200像素的灰度图像,每种缺陷类型包含300个样本,总计1800张图片。通过使用PyTorch框架,结合U-Net架构和ResNet编码器,研究人员可以训练出高效的分割模型,从而准确识别和定位钢材表面的各种缺陷。
解决学术问题
NEU Surface Defect Database 数据集在学术研究中解决了钢材表面缺陷检测的关键问题。传统的缺陷检测方法依赖于人工检查,效率低下且易受主观因素影响。该数据集通过提供高质量的缺陷图像和详细的标注信息,使得基于深度学习的自动化检测成为可能。这不仅提高了检测的准确性和效率,还为相关领域的研究提供了丰富的数据支持。此外,该数据集还促进了图像分割和目标检测算法的发展,推动了计算机视觉技术在工业检测中的应用。
衍生相关工作
NEU Surface Defect Database 数据集的发布催生了一系列相关研究和工作。例如,基于该数据集,研究人员开发了多种先进的图像分割和目标检测算法,如U-Net、FPN(特征金字塔网络)等,这些算法在其他工业检测任务中也得到了广泛应用。此外,该数据集还促进了跨学科的合作,如计算机视觉与材料科学的结合,推动了新型检测技术的研发。一些研究团队还基于该数据集开发了开源工具和平台,方便更多研究人员和工程师进行实验和应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

MinneApple 苹果检测数据集

MinneApple 是一个用于苹果检测和分割的基准数据集。该数据集使用多边形掩码为每个对象实例进行标注,以帮助进行精确的对象检测、定位、和分割。此外,该数据集提供了基于补丁的聚类水果计数数据。该数据集在 1000 张图像中包含超过 41,0000 个带标注的对象实例。

超神经 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录