five

GC10-DET|工业检测数据集|表面缺陷识别数据集

收藏
github2024-02-20 更新2024-05-31 收录
工业检测
表面缺陷识别
下载链接:
https://github.com/CHEN814/defect-detection
下载链接
链接失效反馈
资源简介:
GC10-DET是在真实工业中收集的表面缺陷数据集。它包含十种类型的表面缺陷,即冲孔(Pu)、焊缝(Wl)、新月形缝隙(Cg)、水斑(Water Spot)、油斑(Os)、丝斑(Ss)、夹杂物(In)、轧坑(Rp)、折痕(Cr)、腰部折痕 (Wf)。所收集的缺陷都在钢板的表面。该数据集包括3570张灰度图像。

GC10-DET is a surface defect dataset collected from real industrial environments. It encompasses ten types of surface defects, namely Punching (Pu), Welding Line (Wl), Crescent Gap (Cg), Water Spot, Oil Spot (Os), Silk Spot (Ss), Inclusion (In), Rolled Pit (Rp), Crease (Cr), and Waist Folding (Wf). All the collected defects are located on the surface of steel plates. The dataset comprises 3570 grayscale images.
创建时间:
2024-02-18
原始信息汇总

数据集概述

数据集名称

GC10-DET

数据集描述

GC10-DET是一个在真实工业环境中收集的表面缺陷数据集,包含十种类型的表面缺陷,如冲孔、焊缝、新月形缝隙等。该数据集包含3570张灰度图像,所有缺陷均位于钢板表面。

数据集获取

数据集可在GitHub上获得,链接为:https://github.com/lvxiaoming2019/GC10-DET-Metallic-Surface-Defect-Matasets。若原始数据集存在错误,可使用修正后的版本,链接为:http://t.csdnimg.cn/jNolA。

数据集划分

数据集总共包含2294个样本,按照约9:1的比例划分为训练集和验证集。其中,训练集包含1998个样本,验证集包含296个样本。

数据集格式

为适应YOLOv6模型的需求,数据集需进行格式转换:

  • images:图片被划分在训练集和验证集两个文件夹中。
  • annotations:分别生成train和val的json文件。
  • labels:数据集的标签为xml格式,需转换成txt格式,并对数据进行归一化处理。

YOLO格式数据集下载

YOLO格式的GC10-DET数据集下载链接为:https://pan.baidu.com/s/11slnV0Bvpagweqxzi2UgDw?pwd=zzai,提取码为zzai。

AI搜集汇总
数据集介绍
main_image_url
构建方式
GC10-DET数据集的构建基于真实工业环境中的表面缺陷检测需求,通过无人机搭载的图像探测器采集工厂内部货架图片。数据集涵盖了十种不同类型的表面缺陷,包括冲孔、焊缝、新月形缝隙等,共计3570张灰度图像。为确保数据集的质量和适用性,原始数据经过图片配准及比对,识别并修正了潜在的缺陷,最终形成了包含2294个样本的数据集,并按照9:1的比例划分为训练集和验证集。
特点
GC10-DET数据集的显著特点在于其真实性和多样性。首先,数据集来源于实际工业环境,确保了缺陷样本的真实性和代表性。其次,数据集包含了十种不同类型的表面缺陷,涵盖了多种常见的工业缺陷类型,为算法训练提供了丰富的样本资源。此外,数据集的灰度图像格式和特定的缺陷标注方式,使其特别适用于基于YOLOv6模型的缺陷检测任务。
使用方法
使用GC10-DET数据集进行模型训练和评估时,首先需将数据集转换为YOLOv6模型所需的特定格式,包括图像文件的分类存储和标签文件的格式转换。随后,根据数据集的组织结构,配置相应的训练和验证路径,并选择合适的网络配置文件。在模型训练过程中,可根据实际需求调整训练参数,如设备选择(CPU或GPU)和模型权重。训练完成后,可通过推理脚本对新图像或视频进行缺陷检测,并可视化检测结果。
背景与挑战
背景概述
GC10-DET数据集是在工业环境中收集的表面缺陷检测数据集,由无人机上的图像探测器采集的工厂内部货架图片构成。该数据集由主要研究人员或机构在科研项目的支持下创建,旨在通过图像配准及比对技术,识别如螺丝松动等潜在缺陷,从而预防工业事故。GC10-DET数据集包含十种不同类型的表面缺陷,涵盖了钢板表面的多种常见问题,如冲孔、焊缝、新月形缝隙等。该数据集的创建不仅为表面缺陷检测领域提供了宝贵的资源,还推动了相关算法的发展和优化。
当前挑战
GC10-DET数据集在构建过程中面临多项挑战。首先,数据采集需在复杂的工业环境中进行,确保图像质量的同时,还需处理光照变化、背景噪声等问题。其次,数据集的标注工作复杂且耗时,需精确识别并分类多种表面缺陷,这对标注人员的专业知识和技能提出了高要求。此外,数据集的格式转换和归一化处理也是一大挑战,特别是为了适应YOLOv6模型,需将原始的XML格式标签转换为YOLO所需的TXT格式,并进行归一化处理。最后,模型训练过程中,如何在有限的计算资源下高效训练模型,尤其是在CPU环境下,也是一个需要克服的技术难题。
常用场景
经典使用场景
在工业自动化领域,GC10-DET数据集被广泛应用于表面缺陷检测。该数据集通过无人机采集的工厂内部货架图片,结合图像配准与比对技术,能够有效识别如螺丝松动、钢板表面缺陷等关键问题。这一经典场景不仅提升了工业检测的效率,还为预防潜在安全隐患提供了数据支持。
衍生相关工作
基于GC10-DET数据集,研究者们开发了多种先进的缺陷检测算法,如YOLOv6模型。这些算法不仅提升了检测精度,还优化了检测速度,使得实时监控成为可能。此外,该数据集还激发了关于数据增强和模型泛化能力的研究,进一步推动了工业检测技术的发展。
数据集最近研究
最新研究方向
在工业缺陷检测领域,GC10-DET数据集因其丰富的缺陷类型和高质量的图像数据,成为研究者们关注的焦点。当前的研究主要集中在利用深度学习技术,特别是YOLOv6模型,对钢板表面缺陷进行高效检测。研究者们通过数据集的预处理和格式转换,确保数据集与YOLOv6模型的兼容性,从而提升检测精度。此外,针对CPU环境下训练YOLOv6模型的优化策略也成为研究热点,旨在降低计算资源需求,提高模型训练效率。这些研究不仅推动了工业缺陷检测技术的发展,也为实际应用中的隐患预防提供了技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

GVJahnavi/Crops_set

该数据集包含图像和标签两个主要特征。图像特征的数据类型为图像,标签特征的数据类型为类标签,具体包括20种不同的植物病害和健康状态,如玉米的灰斑病、普通锈病、北方叶枯病,以及番茄的细菌性斑点病、早疫病、晚疫病等。数据集分为训练集和测试集,训练集包含25384个样本,测试集包含6346个样本。数据集的下载大小为514893426字节,总大小为474216412.07000005字节。

hugging_face 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录