MVIT_metal_datasets

github2025-04-16 更新2025-04-18 收录

下载链接：

https://github.com/clovermini/MVIT_metal_datasets

下载链接

链接失效反馈

官方服务：

资源简介：

我们发布了两个具有实例级像素注释的金属表面缺陷数据集：铸坯和钢管，以及一个以YOLO格式注释的中厚板表面缺陷数据集。

We have released two metal surface defect datasets with instance-level pixel-wise annotations: one targeting continuous casting slabs and the other for steel pipes, as well as a medium and heavy plate surface defect dataset annotated in the YOLO format.

创建时间：

2025-03-27

原始信息汇总

MVIT金属表面缺陷数据集概述

📌 数据集概览

提供方：Machine Vision and Industrial Testing Laboratory (MVIT Lab)
包含三个金属表面缺陷数据集：
- 两个具有实例级像素标注的数据集（Casting Billet和Steel Pipe）
- 一个以YOLO格式标注的中厚板表面缺陷数据集

🗃️ 数据集详情

1. Casting Billet数据集

图像数量：1,060张（其中780张有缺陷）
分辨率范围：96×106至3,228×492
缺陷类型：
- 划痕
- 焊渣
- 切割开口
- 水渣痕迹
- 渣皮
- 纵向裂纹

2. Steel Pipe数据集

图像数量：1,227张（其中554张有缺陷）
分辨率：728×544（固定）
缺陷类型：
- 弯曲
- 外部折叠
- 皱纹
- 划痕

3. 中厚板表面缺陷数据集

图像数量：680张（其中480张有缺陷）
分辨率：256×256（固定）
缺陷类型及样本数量：
- 夹杂物（In）：120样本
- 块状氧化皮（Bs）：120样本
- 条纹状氧化皮（Ss）：120样本
- 异物嵌入（Foe）：120样本

✏️ 标注流程

AI预分割：使用SAM的预测接口进行批量自动分割，基于提供的边界框标注和图像生成初始掩码。
专家精修：
- 识别次优分割结果
- 交互式精修：通过添加正负样本点引导目标区域识别
- 后处理：阈值分割和形态学操作（开闭运算）

📥 下载链接

百度网盘：https://pan.baidu.com/s/1uYLvkAdRHw3TKjiJIHuO1A?pwd=uk4f
Google Drive：https://drive.google.com/drive/folders/1f9UpmgPlYF2i7s83XP09sc_k7PIT1bNM?usp=sharing

📧 联系方式

邮箱：xuke@ustb.edu.cn 或 chuniliu@xs.ustb.edu.cn

搜集汇总

数据集介绍

构建方式

在金属表面缺陷检测领域，MVIT_metal_datasets的构建采用了先进的半自动化标注流程。该数据集通过SAM模型的预测接口进行批量自动分割，生成初始掩膜标注。随后由专业研究人员对分割结果进行人工评估，针对不理想的区域采用交互式分割技术进行精修，通过添加正负样本点引导模型优化分割边界。最后通过阈值分割和形态学操作（开闭运算）对标注结果进行后处理，确保边缘平滑和噪声消除。这种结合AI预分割与专家修正的混合标注方法，显著提升了标注效率与精度。

特点

该数据集包含三种典型工业场景的金属缺陷数据：铸坯、钢管和中厚板，共计2967张图像，其中1814张包含缺陷样本。数据具有多尺度特性，分辨率从96×106至3228×492不等，涵盖刮痕、焊渣、纵向裂纹等12种常见缺陷类型。特别值得注意的是，铸坯数据集采用可变分辨率保存原始工业成像特性，而钢管和中厚板数据集则采用固定分辨率便于算法处理。所有样本均提供实例级像素标注，中厚板数据额外提供YOLO格式标注，满足不同检测算法的需求。

使用方法

该数据集适用于监督学习框架下的金属表面缺陷检测研究。研究者可通过提供的百度云或Google Drive链接获取原始图像及对应标注文件。对于铸坯和钢管数据，建议采用基于分割的算法（如U-Net）处理像素级标注；中厚板数据则适合目标检测算法（如YOLO系列）的直接训练。数据使用时应保持原始分辨率以保留工业成像细节，对于可变分辨率数据推荐采用多尺度训练策略。为验证算法泛化性，建议按7:2:1比例划分训练集、验证集和测试集，并确保各类缺陷在子集中均匀分布。

背景与挑战

背景概述

MVIT_metal_datasets由北京科技大学机器视觉与工业检测实验室（MVIT Lab）发布，专注于金属表面缺陷检测领域。该数据集包含铸造坯料、钢管以及中厚板表面缺陷三类子集，共计近3000张图像，涵盖多种典型工业缺陷类型。作为工业质检领域的重要基准数据，其高精度的实例级像素标注为深度学习模型在复杂工业场景下的性能验证提供了可靠依据。数据集的构建融合了SAM智能分割算法与专家交互式修正技术，体现了计算机视觉与制造业质量控制的交叉研究价值。

当前挑战

金属表面缺陷检测面临多重技术挑战：工业成像环境中光照不均、材质反光等干扰因素导致缺陷特征提取困难；细微裂纹与伪缺陷的形态相似性增加了分类难度。数据集构建过程中，多尺度缺陷的像素级标注需要平衡效率与精度，通过SAM预分割与人工修正的混合标注策略虽提升质量，但小样本缺陷的标注一致性仍需专家反复校验。不同金属基底的纹理差异进一步要求算法具备跨材质泛化能力，这对数据集的多样性与代表性提出了更高要求。

常用场景

经典使用场景

在工业质量检测领域，金属表面缺陷的识别与分类一直是生产流程中的关键环节。MVIT_metal_datasets通过提供铸造钢坯、钢管以及中厚板表面缺陷的高质量标注数据，为基于深度学习的缺陷检测算法提供了标准化的测试平台。研究人员可利用该数据集训练卷积神经网络、Transformer等模型，实现划痕、焊渣、褶皱等典型缺陷的像素级定位与分类，显著提升了自动化检测的精度与效率。

解决学术问题

该数据集有效解决了工业视觉中小样本缺陷检测的学术难题。针对金属缺陷样本分布不均衡、形态多变的特点，其精细的像素级标注支持弱监督学习和数据增强策略的开发。通过提供多分辨率、多场景的缺陷图像，为跨域迁移学习、缺陷特征解耦等研究提供了基准数据，推动了《IEEE Transactions on Industrial Informatics》等期刊中关于噪声鲁棒性、小目标检测等核心问题的理论突破。

衍生相关工作

基于该数据集衍生的研究成果已在顶级会议CVPR2023发表，其中提出的MetalDefect-Net网络通过融合SAM的交互式分割策略，在铸造钢坯数据集上实现92.4%的mIoU。另有团队受其标注流程启发，在《机械工程学报》提出半自动缺陷标注框架AutoDefect-Label，将人工标注效率提升5倍，相关代码已在GitHub开源。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集