SteelBlastQC
收藏arXiv2025-04-29 更新2025-05-01 收录
下载链接:
https://doi.org/10.34894/EKZNN0
下载链接
链接失效反馈官方服务:
资源简介:
SteelBlastQC是一个开放源代码的数据集,由荷兰马斯特里赫特大学先进计算科学系创建,包含1654张分辨率为512x512像素的RGB图像,用于检测喷砂处理后的钢表面缺陷。数据集由来自工业制造工厂的高分辨率图像组成,并由领域专家标记为“适合涂漆”或“需要喷砂处理”,以反映实际的质量控制标准。数据集旨在支持在喷砂表面质量控制中进行缺陷检测的进一步研究,推动可解释的计算机视觉模型的发展,并促进在工业应用中采用自动检测系统。
SteelBlastQC is an open-source dataset created by the Department of Advanced Computing Sciences, Maastricht University, the Netherlands. It contains 1654 RGB images with a resolution of 512×512 pixels for defect detection on steel surfaces after shot blasting. The dataset consists of high-resolution images sourced from industrial manufacturing plants, and has been annotated by domain experts with two labels: "paint-ready" and "requiring re-blasting", which align with actual quality control standards. This dataset aims to support further research on defect detection for shot-blasted surface quality control, promote the development of interpretable computer vision models, and facilitate the adoption of automated detection systems in industrial applications.
提供机构:
荷兰马斯特里赫特大学先进计算科学系
创建时间:
2025-04-29
原始信息汇总
SteelBlastQC Dataset 概述
基本信息
- 标题: SteelBlastQC Dataset
- 副标题: Shot-blasted Steel Surface Dataset with Interpretable Detection of Surface Defects
- 版本: 1.0
- 发布日期: 2025-04-24
- DOI: https://doi.org/10.34894/EKZNN0
- 作者:
- Ruzavina, Irina (Maastricht University)
- Theis, Lisa Sophie (Maastricht University)
- Lemeer, Jesse (Maastricht University)
- de Groen, Rutger (Maastricht University)
- Ebeling, Leo (Maastricht University)
- Hulak, Andrej (Maastricht University)
- Ali, Jouaria (Maastricht University)
- Tang, Guangzhi (Maastricht University) - ORCID: 0000-0002-0204-9225
- Mockel, Rico (Maastricht University) - ORCID: 0000-0001-5497-3754
数据集描述
- 内容: 包含1654张RGB图像(512×512像素),展示经过喷砂处理或需要喷砂处理的钢表面,形成一个二元分类任务。
- “good”类: 888张图像,表示表面已准备好进行涂装。
- “not-good”类: 766张图像,表示表面需要喷砂处理。
- 理想表面: 清洁且均匀粗糙,平均粗糙度为SA 2.5。
- 缺陷类型: 包括新鲜焊接线和切割、磨损、腐蚀和变色。
- 用途: 用于训练计算机视觉模型,实现金属表面质量控制的自动化。
- 数据划分: 按80/20比例分为训练集和测试集。
主题与关键词
- 主题: Computer and Information Science; Engineering
- 关键词: Shot-blasting, Steel Surfaces, Computer Vision, Quality Control
相关出版物
- Irina Ruzavina, Lisa Sophie Theis, Jesse Lemeer, Rutger de Groen, Leo Ebeling, Andrej Hulak, Jouaria Ali, Guangzhi Tang, Rico Mockel, "SteelBlastQC: Shot-blasted Steel Surface Dataset with Interpretable Detection of Surface Defects", 2025 International Joint Conference on Neural Networks (IJCNN 2025).
附加信息
- 源代码: 包括数据加载器和示例数据使用实验,位于https://github.com/ERNIS-LAB/SteelBlastQC。
- 许可证: CC-BY-4.0
文件信息
- 文件总数: 1,656
- 主要文件类型:
- Image (1,654)
- Data (1)
- Text (1)
- 示例文件:
SteelBlastQC_Readme.txt: 数据集结构、收集和预处理过程的描述。annotations.csv: 标注文件。- 示例图像文件(如
slice000_002.png等)。
下载信息
- 下载次数: 11,760
- 下载选项:
搜集汇总
数据集介绍

构建方式
SteelBlastQC数据集的构建过程严格遵循工业质量控制标准,通过高分辨率图像采集技术,在受控光照条件下使用Fujifilm X-T30 II相机对游艇钢制船体外表面进行拍摄。原始图像经专业裁剪处理,从2048×2048像素中心区域分割为16个512×512像素样本,确保纹理细节的完整保留。数据集包含888张'可喷涂'和766张'需喷砂处理'的标注图像,所有标注均由工业喷砂专家完成,真实反映了焊接线、划痕、腐蚀等六类典型表面缺陷。
使用方法
研究者可采用三种典型范式开发利用该数据集:基于Compact Convolutional Transformers的端到端训练可获得95%的分类准确率,特别适合需要捕捉长程依赖关系的表面纹理分析;采用ResNet-50特征提取结合SVM的方案在保持94.5%准确率的同时显著降低计算成本;而卷积自编码器的无监督方法为缺陷检测提供了67%准确率的基线参考。数据集已预分割为80%训练集和20%测试集,并附赠Grad-CAM热力图生成代码,支持模型决策的可解释性分析。
背景与挑战
背景概述
SteelBlastQC数据集由荷兰马斯特里赫特大学高级计算科学系的Irina Ruzavina等研究人员于2025年创建,旨在推动喷砂钢表面质量控制的自动化研究。该数据集包含1654张高分辨率RGB图像(512×512像素),由领域专家标注为'可喷涂'或'需喷砂'两类,涵盖了真实工业场景中常见的表面缺陷类型,如变色、焊缝、划痕和腐蚀等。作为首个专注于喷砂工艺质量控制的公开数据集,其创新性地融合了可解释性计算机视觉技术,为工业质检领域提供了重要的基准数据和研究框架,对推动智能制造中的自动化表面检测技术发展具有显著意义。
当前挑战
该数据集主要面临三方面挑战:在领域问题层面,喷砂钢表面缺陷检测需同时识别宏观纹理异常与微观局部缺陷,且不同缺陷类型在视觉特征上存在高度相似性;在数据构建过程中,工业现场的光照条件变化和金属表面反光特性导致图像采集质量不稳定,而专家标注标准的主观差异也影响了标签一致性;在算法应用方面,现有模型对焊接线等线性缺陷的检测精度不足,且无监督方法在复杂纹理背景下的误报率较高,这要求开发更具鲁棒性的特征提取和决策解释机制。
常用场景
经典使用场景
SteelBlastQC数据集在工业制造领域中被广泛用于训练计算机视觉模型,以实现钢材表面喷砂处理质量的自动化检测。该数据集包含1654张高分辨率RGB图像,涵盖了多种真实世界中的表面缺陷,如变色、焊接线、划痕和腐蚀等。研究人员利用这些数据训练深度学习模型,如紧凑卷积变换器(CCT)和支持向量机(SVM),以区分“可喷涂”和“需喷砂”的钢材表面,准确率高达95%。
解决学术问题
SteelBlastQC数据集解决了工业质检中表面缺陷检测的多个关键学术问题。首先,它填补了现有数据集中理想化缺陷类型与实际工业场景之间的差距,提供了多样化的真实缺陷样本。其次,通过引入可解释的深度学习技术,如Grad-CAM热力图,该数据集帮助研究人员理解模型决策过程,增强了模型在工业应用中的可信度。此外,数据集还支持无监督学习方法(如卷积自编码器)的基准测试,为自动化质检提供了新的研究方向。
实际应用
在实际应用中,SteelBlastQC数据集为制造业的自动化质检系统提供了重要支持。例如,在船舶制造和钢结构生产中,该数据集训练的模型能够快速检测钢材表面的喷砂质量,显著提升生产效率并降低人工成本。通过部署基于CCT或SVM的视觉系统,企业能够实现每小时20平方米以上的检测速度,同时避免工人暴露于有毒粉尘和高噪音环境。数据集的开放共享进一步推动了工业界对自动化质检技术的采纳。
数据集最近研究
最新研究方向
在钢铁制造领域,表面缺陷检测一直是质量控制的关键环节。近期,SteelBlastQC数据集的推出为这一领域注入了新的研究活力。该数据集以其高分辨率的RGB图像和详尽的缺陷标注,为基于计算机视觉的表面缺陷检测提供了宝贵资源。前沿研究主要集中在三个方面:一是基于Transformer架构的Compact Convolutional Transformers(CCT)模型,其注意力机制能够有效捕捉局部纹理和全局模式,在测试中达到了95%的分类准确率;二是结合ResNet-50特征提取与支持向量机(SVM)的混合方法,在保持较高准确率的同时提升了计算效率;三是探索无监督学习的卷积自编码器(CAE)方法,为缺乏标注数据的场景提供了可行方案。这些研究不仅推动了工业质检的智能化进程,其可解释性技术更增强了模型在工业场景中的可信度。随着智能制造的发展,如何将这类方法部署到实时检测系统,并适应更复杂的缺陷类型,将成为未来的重点研究方向。
相关研究论文
- 1SteelBlastQC: Shot-blasted Steel Surface Dataset with Interpretable Detection of Surface Defects荷兰马斯特里赫特大学先进计算科学系 · 2025年
以上内容由遇见数据集搜集并总结生成



