five

GC10-DET|工业检测数据集|表面缺陷识别数据集

收藏
github2024-02-20 更新2024-05-31 收录
工业检测
表面缺陷识别
下载链接:
https://github.com/CHEN814/defect-detection
下载链接
链接失效反馈
资源简介:
GC10-DET是在真实工业中收集的表面缺陷数据集。它包含十种类型的表面缺陷,即冲孔(Pu)、焊缝(Wl)、新月形缝隙(Cg)、水斑(Water Spot)、油斑(Os)、丝斑(Ss)、夹杂物(In)、轧坑(Rp)、折痕(Cr)、腰部折痕 (Wf)。所收集的缺陷都在钢板的表面。该数据集包括3570张灰度图像。

GC10-DET is a surface defect dataset collected from real industrial environments. It encompasses ten types of surface defects, namely Punching (Pu), Welding Line (Wl), Crescent Gap (Cg), Water Spot, Oil Spot (Os), Silk Spot (Ss), Inclusion (In), Rolled Pit (Rp), Crease (Cr), and Waist Folding (Wf). All the collected defects are located on the surface of steel plates. The dataset comprises 3570 grayscale images.
创建时间:
2024-02-18
原始信息汇总

数据集概述

数据集名称

GC10-DET

数据集描述

GC10-DET是一个在真实工业环境中收集的表面缺陷数据集,包含十种类型的表面缺陷,如冲孔、焊缝、新月形缝隙等。该数据集包含3570张灰度图像,所有缺陷均位于钢板表面。

数据集获取

数据集可在GitHub上获得,链接为:https://github.com/lvxiaoming2019/GC10-DET-Metallic-Surface-Defect-Matasets。若原始数据集存在错误,可使用修正后的版本,链接为:http://t.csdnimg.cn/jNolA。

数据集划分

数据集总共包含2294个样本,按照约9:1的比例划分为训练集和验证集。其中,训练集包含1998个样本,验证集包含296个样本。

数据集格式

为适应YOLOv6模型的需求,数据集需进行格式转换:

  • images:图片被划分在训练集和验证集两个文件夹中。
  • annotations:分别生成train和val的json文件。
  • labels:数据集的标签为xml格式,需转换成txt格式,并对数据进行归一化处理。

YOLO格式数据集下载

YOLO格式的GC10-DET数据集下载链接为:https://pan.baidu.com/s/11slnV0Bvpagweqxzi2UgDw?pwd=zzai,提取码为zzai。

AI搜集汇总
数据集介绍
main_image_url
构建方式
GC10-DET数据集的构建基于真实工业环境中的表面缺陷检测需求,通过无人机搭载的图像探测器采集工厂内部货架图片。数据集涵盖了十种不同类型的表面缺陷,包括冲孔、焊缝、新月形缝隙等,共计3570张灰度图像。为确保数据集的质量和适用性,原始数据经过图片配准及比对,识别并修正了潜在的缺陷,最终形成了包含2294个样本的数据集,并按照9:1的比例划分为训练集和验证集。
特点
GC10-DET数据集的显著特点在于其真实性和多样性。首先,数据集来源于实际工业环境,确保了缺陷样本的真实性和代表性。其次,数据集包含了十种不同类型的表面缺陷,涵盖了多种常见的工业缺陷类型,为算法训练提供了丰富的样本资源。此外,数据集的灰度图像格式和特定的缺陷标注方式,使其特别适用于基于YOLOv6模型的缺陷检测任务。
使用方法
使用GC10-DET数据集进行模型训练和评估时,首先需将数据集转换为YOLOv6模型所需的特定格式,包括图像文件的分类存储和标签文件的格式转换。随后,根据数据集的组织结构,配置相应的训练和验证路径,并选择合适的网络配置文件。在模型训练过程中,可根据实际需求调整训练参数,如设备选择(CPU或GPU)和模型权重。训练完成后,可通过推理脚本对新图像或视频进行缺陷检测,并可视化检测结果。
背景与挑战
背景概述
GC10-DET数据集是在工业环境中收集的表面缺陷检测数据集,由无人机上的图像探测器采集的工厂内部货架图片构成。该数据集由主要研究人员或机构在科研项目的支持下创建,旨在通过图像配准及比对技术,识别如螺丝松动等潜在缺陷,从而预防工业事故。GC10-DET数据集包含十种不同类型的表面缺陷,涵盖了钢板表面的多种常见问题,如冲孔、焊缝、新月形缝隙等。该数据集的创建不仅为表面缺陷检测领域提供了宝贵的资源,还推动了相关算法的发展和优化。
当前挑战
GC10-DET数据集在构建过程中面临多项挑战。首先,数据采集需在复杂的工业环境中进行,确保图像质量的同时,还需处理光照变化、背景噪声等问题。其次,数据集的标注工作复杂且耗时,需精确识别并分类多种表面缺陷,这对标注人员的专业知识和技能提出了高要求。此外,数据集的格式转换和归一化处理也是一大挑战,特别是为了适应YOLOv6模型,需将原始的XML格式标签转换为YOLO所需的TXT格式,并进行归一化处理。最后,模型训练过程中,如何在有限的计算资源下高效训练模型,尤其是在CPU环境下,也是一个需要克服的技术难题。
常用场景
经典使用场景
在工业自动化领域,GC10-DET数据集被广泛应用于表面缺陷检测。该数据集通过无人机采集的工厂内部货架图片,结合图像配准与比对技术,能够有效识别如螺丝松动、钢板表面缺陷等关键问题。这一经典场景不仅提升了工业检测的效率,还为预防潜在安全隐患提供了数据支持。
衍生相关工作
基于GC10-DET数据集,研究者们开发了多种先进的缺陷检测算法,如YOLOv6模型。这些算法不仅提升了检测精度,还优化了检测速度,使得实时监控成为可能。此外,该数据集还激发了关于数据增强和模型泛化能力的研究,进一步推动了工业检测技术的发展。
数据集最近研究
最新研究方向
在工业缺陷检测领域,GC10-DET数据集因其丰富的缺陷类型和高质量的图像数据,成为研究者们关注的焦点。当前的研究主要集中在利用深度学习技术,特别是YOLOv6模型,对钢板表面缺陷进行高效检测。研究者们通过数据集的预处理和格式转换,确保数据集与YOLOv6模型的兼容性,从而提升检测精度。此外,针对CPU环境下训练YOLOv6模型的优化策略也成为研究热点,旨在降低计算资源需求,提高模型训练效率。这些研究不仅推动了工业缺陷检测技术的发展,也为实际应用中的隐患预防提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UCI Machine Learning Repository

UCI机器学习库是一个包含数据库、领域理论和数据生成器的集合,这些被机器学习社区用于机器学习算法的实证分析。

github 收录

MECCANO

MECCANO数据集是首个专注于工业类似环境中第一人称视角下人类-物体交互的研究数据集。该数据集由20名参与者在模拟工业场景中构建摩托车玩具模型的视频组成,包含299,376帧视频数据。数据集不仅标注了时间上的动作片段,还标注了空间上的活跃物体边界框,涵盖了12种动词、20种名词和61种独特动作的分类。MECCANO数据集旨在推动工业环境中第一人称视角下人类动作识别、活跃物体检测、活跃物体识别及第一人称视角下人类-物体交互检测等任务的研究。

arXiv 收录

UCI Wine

UCI Wine数据集包含了178个样本,每个样本有13个特征,用于分类任务。这些特征包括葡萄酒的化学成分,如酒精含量、苹果酸、灰分等。数据集的目标是将葡萄酒分类为三个不同的品种。

archive.ics.uci.edu 收录

Pet Disease images

Comprehensive Image Dataset for Detecting Pet Diseases Across Multiple Species

kaggle 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录