five

TOFD Defects Dataset

收藏
github2025-11-10 更新2025-11-11 收录
下载链接:
https://github.com/leonidmedved/TOFD-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于训练和验证从TOFD(飞行时间衍射)数据中进行缺陷分割的神经网络。包含在CIVA软件包中使用铅笔法模拟的合成数据和在带有故意引入缺陷的块上进行的真实测量数据。数据分为训练集和验证集,包含8种缺陷类别标签。

This dataset is designed for training and validating neural networks that perform defect segmentation from TOFD (Time-of-Flight Diffraction) data. It encompasses two types of data: synthetic data simulated via the pencil method within the CIVA software package, and real-world measured data collected from blocks with intentionally introduced defects. The dataset is divided into training and validation subsets, with annotation labels covering 8 defect categories.
创建时间:
2025-11-06
原始信息汇总

TOFD缺陷数据集概述

1. 数据集基本信息

  • 用途:用于训练和验证从TOFD(飞行时间衍射)数据中进行缺陷分割的神经网络
  • 数据类型
    • 合成数据:通过CIVA软件包使用铅笔法模拟的回波信号
    • 真实数据:在含有人工缺陷的试块上进行的测量数据
  • 数据划分:包含训练集和验证集

2. 数据结构

DATASTORES/ ├── actualdatastore/ │ ├── data_real+civa/ # 训练图像 │ ├── data_real+civa_val/ # 验证图像 │ ├── mask_real+civa/ # 训练掩码 │ ├── mask_real+civa_val/ # 验证掩码 ├── OriginalData/ │ ├── data_base/ # 真实测量原始图像 │ ├── mask_base/ # 真实数据图像掩码 │ ├── civa_base/ # CIVA生成图像 │ ├── mask_civa/ # CIVA图像掩码 │ ├── Data_mix/ # 合并数据集(真实数据+CIVA) │ ├── Mask_mix/ # 合并数据集掩码

3. 类别与标签

标签ID 类别 缺陷类型 真实缺陷示例 CIVA模拟
0 E 无缺陷
50 LSUP 扩展近表面缺陷 咬边、边缘未熔合 凹槽、外侧圆柱孔
100 LSDN 扩展近根部/底部缺陷 根部未熔合、收缩、过度渗透 凹槽、底部圆柱孔、收缩模拟
125 LBIN 扩展内部缺陷 边界未熔合、焊道间未熔合 内部凹槽、侧向圆柱孔
150 VI 单个体积缺陷 夹渣、气孔、夹杂物 球体、垂直孔
200 VC 体积缺陷簇 密集气孔、夹渣夹杂物、多层缺陷 球体簇(仅模拟)
220 HW 头波
250 BS 底部信号

4. 合成数据(CIVA)

  • 模拟方法:基于束管理论的CIVA回波模型
  • 模拟缺陷类型
    • 底部裂纹
    • 内部裂纹
    • 近表面裂纹
    • 球形缺陷
    • 侧向圆柱孔(模拟未熔合)
  • 缺陷参数范围
    • 高度:0.5-20 mm
    • 宽度:2.5-25 mm
  • 噪声模型:随机分布点反射体,密度为2反射体/mm³

5. 真实数据

  • 材料:20号钢
  • 厚度:25 mm
  • 样本数量:2个金属试块
  • 人工缺陷数量:每个样本8个缺陷
  • 缺陷类型分布
    • 6个底部裂纹(凹槽)
    • 6个近表面裂纹(凹槽)
    • 4个内部裂纹(侧槽)
  • 测量设置
    • 传感器:5 MHz,Ø6 mm
    • 入射角:60°
    • 测量方式:从样本两侧测量
    • 扫描步长:
      • X轴:0.5 mm
      • Y轴:0.2 mm
    • Y轴总计:170组回波信号

6. 数据增强

提供MATLAB图像数据增强器,支持随机平移和缩放操作。

7. 使用用途

  • 训练分割模型(U-Net、U-Net++、Attention U-Net等)
  • 测试合成数据与真实数据的鲁棒性
  • 开发信号滤波和后处理方法

8. 许可证

  • 许可证类型:知识共享署名-非商业性使用4.0国际许可(CC BY-NC 4.0)
  • 使用限制:允许研究和教育用途,禁止商业使用
搜集汇总
数据集介绍
main_image_url
构建方式
在无损检测领域,TOFD缺陷数据集的构建融合了数值模拟与物理实验的双重路径。合成数据部分依托CIVA软件平台,采用铅笔法声束模型对五种典型缺陷进行参数化仿真,涵盖0.5-20mm高度范围的裂纹与球状缺陷,并引入每立方毫米2个反射体的随机噪声以模拟真实信噪比。实测数据则通过定制化钢制试块实现,在25mm厚钢板中预制16组人工缺陷,采用5MHz探头以0.5mm步距进行双面扫查,最终形成包含170组信号序列的立体数据集。
特点
该数据集的核心价值在于其多维度的缺陷表征体系。通过八类精细标注的缺陷标签体系,既包含LSUP近表面扩展型缺陷与LSDN根部缺陷等工程常见缺陷,也涵盖VI单点体积型缺陷与VC集群缺陷的细分类别。特别值得关注的是数据集实现了仿真与实测数据的语义对齐,CIVA模拟的横向圆柱孔与实测的未熔合缺陷在LBIN类别中形成映射,这种跨数据源的类别统一为模型泛化能力验证提供了坚实基础。
使用方法
针对工业检测场景的模型开发,该数据集支持端到端的语义分割流程。通过MATLAB的imageDatastore与pixelLabelDatastore组件,可快速构建包含原图与像素标签的数据管道。内置的图像增强器支持±10像素平移与0.85-1.15尺度变换,有效提升模型鲁棒性。研究者可基于U-Net等架构开展跨域验证,通过对比合成数据训练与真实数据测试的性能差异,推动检测算法在复杂工业环境中的实际部署。
背景与挑战
背景概述
TOFD缺陷数据集诞生于工业无损检测领域对自动化缺陷识别的迫切需求,由研究团队结合CIVA仿真软件与实物样本实验于近年联合构建。该数据集聚焦于超声衍射时差法检测技术,针对焊接结构中常见的裂纹、气孔等缺陷类型,通过融合仿真数据与实测数据为机器学习模型提供训练基础。其多类别标注体系覆盖了从表面延伸缺陷到体积型缺陷的完整谱系,显著推动了超声图像语义分割技术在工业质检中的标准化进程。
当前挑战
该数据集面临的核心挑战在于解决超声衍射信号中缺陷特征的精细分割问题,特别是区分形态相似的近表面裂纹与根部缺陷。构建过程中需克服仿真数据与真实物理场景的域适应难题,包括CIVA模拟中点状反射体噪声建模与实测信号中材料噪声的匹配。同时,在有限样本条件下保持八类缺陷标注的平衡性,以及确保2毫米级微小缺陷在170组扫描信号中的可辨识度,均是数据构建的关键技术瓶颈。
常用场景
经典使用场景
在无损检测领域,TOFD缺陷数据集为深度学习模型提供了标准化的训练与验证平台。该数据集通过结合CIVA软件生成的合成数据与真实工件测量数据,构建了包含八类典型缺陷的像素级标注样本,涵盖近表面裂纹、根部缺陷、体积型缺陷等多种形态。研究人员可利用U-Net、U-Net++等语义分割网络,对TOFD扫描图像中的缺陷区域进行精确识别与轮廓提取,有效解决了传统人工判读效率低下、主观性强的问题。这种数据驱动方法显著提升了缺陷检测的自动化水平,为工业无损检测的智能化转型奠定了坚实基础。
解决学术问题
该数据集主要应对超声检测中缺陷定量分析的学术挑战。通过提供具有精确像素标签的合成与真实数据,解决了深度学习模型在少量真实样本场景下的训练难题。其多类别缺陷标注体系支持对裂纹形态、孔隙分布等微观特征的量化研究,促进了缺陷识别算法在噪声干扰、信号衰减等复杂工况下的鲁棒性提升。该资源填补了TOFD领域高质量标注数据的空白,推动了计算机视觉技术与无损检测理论的跨学科融合,为新型检测算法的性能评估建立了标准化基准。
衍生相关工作
基于该数据集衍生的经典研究包括注意力机制与U-Net架构的融合创新,如Attention U-Net在复杂背景下的缺陷分割应用。多项工作探索了生成对抗网络在TOFD数据增强中的潜力,通过风格迁移技术缓解合成与真实数据的域间差异。部分学者利用该数据集构建了多任务学习框架,同步实现缺陷分类、定位与尺寸回归。这些研究不仅深化了对超声信号特征表示的理解,还催生了系列面向工业检测的专用神经网络架构,形成了以数据驱动为核心的无损检测研究新范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作