five

Welding Defect Dataset|焊接缺陷数据集|质量控制数据集

收藏
github2022-12-18 更新2024-05-31 收录
焊接缺陷
质量控制
下载链接:
https://github.com/sammyboi1801/welding-defect-detection
下载链接
链接失效反馈
资源简介:
该数据集由Godrej Aerospace提供,包含影响焊接过程的多个参数,如环境温度、焊接作业温度、湿度、电压电流、焊接速度、保护气体流量和金属成分等。此外,还提供了用于高级分析的机器数据和焊工详细信息。

This dataset, provided by Godrej Aerospace, encompasses multiple parameters that influence the welding process, including ambient temperature, welding operation temperature, humidity, voltage and current, welding speed, shielding gas flow rate, and metal composition. Additionally, it includes machine data and detailed information about the welders for advanced analysis.
创建时间:
2022-12-18
原始信息汇总

数据集概述

问题陈述

  • 使用ML模型预测焊接缺陷。
  • 开发算法使用提供的参数。
  • 目标是帮助Godrej Aerospace生产无缺陷产品。

数据集提供

  • 参数包括:环境温度、焊接作业温度、湿度、电压电流、焊接速度、保护气体流量、金属成分。
  • 机器数据包括焊接者详情。

数据集分析

  1. 参数相关性

    • 发现电流与电压、温度与湿度之间存在显著相关性。
    • 电流与电压的相关性符合欧姆定律(V=IR)。
    • 温度与湿度的正相关性是物理现象。
  2. 焊接作业温度影响

    • 高焊接作业温度可能导致钨夹杂物。
    • 建议焊接温度范围为30-60摄氏度。
  3. 电流和电压影响

    • 高电流导致高热量,增加钨夹杂物的可能性。
    • 电压也可能影响钨夹杂物。
  4. 温度、湿度和流量对气孔的影响

    • 温度和湿度对气孔的影响有限。
    • 气孔的平均流量高于无缺陷和钨夹杂物。
  5. 数据不平衡处理

    • 使用过采样、欠采样和SMOTE技术。
    • 结合三种方法创建稳健的数据集。

使用的模型

  • 尝试了SVM、Adaboost、决策树、随机森林和梯度提升算法。
  • 最终选择XGBoost,达到96%的准确率和良好的F1分数。

模型部署

  • 使用Tailwind CSS和Flask服务器部署在AWS EC2上。
  • 模型效率高,运行时仅占用30%的1GB RAM,模型大小为35MB。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由Godrej Aerospace公司提供,基于其历史焊接活动记录构建。数据集涵盖了影响焊接过程的多个参数,包括环境温度、焊接作业温度、湿度、电压电流、焊接速度、保护气体流量以及金属成分等。此外,还提供了焊接设备的详细数据和焊接操作人员的信息。数据集的构建旨在通过机器学习模型预测焊接缺陷,从而帮助生产无缺陷的产品。
特点
该数据集的特点在于其多维度的参数覆盖,能够全面反映焊接过程中的各种影响因素。通过相关性分析,发现电流与电压、温度与湿度之间存在显著的相关性,这与物理定律相符。此外,数据集还揭示了焊接作业温度与钨夹杂缺陷之间的关联,以及电流和电压对焊接质量的影响。数据集的不平衡性通过过采样、欠采样和SMOTE技术的结合得到了有效处理,确保了模型的训练效果。
使用方法
该数据集的使用方法主要包括数据预处理、模型训练和部署。在预处理阶段,通过相关性分析和数据平衡技术对数据集进行优化。模型训练阶段,采用了XGBoost算法,经过参数调优后,模型在测试集上达到了96%的准确率和较高的F1分数。最终,模型通过Flask服务器部署在AWS EC2实例上,形成了一个高效的焊接缺陷预测系统。用户可以通过提供的代码和模型文件,自行复现或扩展该系统的功能。
背景与挑战
背景概述
Welding Defect Dataset是由Godrej Aerospace在2022年IIT Techfest Weldright Hackathon中提供的焊接缺陷预测数据集。该数据集旨在通过机器学习模型预测焊接过程中的缺陷,从而帮助Godrej Aerospace生产无缺陷的产品。数据集包含了影响焊接过程的多个参数,如环境温度、焊接作业温度、湿度、电压电流、焊接速度、保护气体流量和金属成分等。这些数据来源于Godrej Aerospace过去的焊接活动记录,旨在通过高级分析技术优化焊接工艺。该数据集的发布为焊接工艺的自动化质量控制提供了重要的数据支持,推动了焊接缺陷预测领域的研究进展。
当前挑战
Welding Defect Dataset面临的主要挑战包括数据不平衡问题和多变量之间的复杂关系。首先,数据集中不同类别的样本分布不均,特别是无缺陷样本占主导,而缺陷样本(如孔隙和钨夹杂)数量较少,这可能导致模型训练时出现偏差。其次,焊接过程中的多个参数(如电流、电压、温度等)之间存在复杂的物理关系,如何有效提取这些特征并建立准确的预测模型是一个技术难点。此外,构建数据集时还需考虑如何平衡数据的多样性和规模,以确保模型的泛化能力。这些挑战要求研究人员在数据预处理、特征工程和模型选择上进行深入探索,以实现高精度的焊接缺陷预测。
常用场景
经典使用场景
在焊接工艺的优化和质量控制领域,Welding Defect Dataset被广泛应用于机器学习模型的训练与测试。通过分析焊接过程中的环境温度、湿度、电压电流、焊接速度等关键参数,该数据集帮助研究人员构建预测模型,以识别和预测焊接缺陷,如钨夹杂和气孔等。这一数据集的使用场景主要集中在工业生产中的焊接质量监控和缺陷预防,尤其是在航空航天等高精度制造领域。
实际应用
在实际应用中,Welding Defect Dataset被用于开发智能焊接监控系统。通过部署基于XGBoost算法的预测模型,企业能够实时监测焊接过程中的关键参数,并提前预警潜在的焊接缺陷。这种技术显著降低了生产中的废品率,提高了焊接产品的质量稳定性。特别是在航空航天制造领域,该数据集的应用帮助实现了零缺陷焊接的目标,极大地提升了生产效率和产品可靠性。
衍生相关工作
基于Welding Defect Dataset,许多经典研究工作得以展开。例如,研究人员利用该数据集开发了基于XGBoost的高精度焊接缺陷预测模型,并通过Flask框架将其部署为可扩展的Web应用。此外,该数据集还催生了多种数据平衡技术的研究,如混合采样方法的应用。这些工作不仅推动了焊接工艺的智能化发展,也为其他工业领域的缺陷预测提供了重要的参考和借鉴。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

Amazon Product Data

该数据集包含亚马逊产品的详细信息,包括产品规格、价格、折扣、客户评价和用户评分等字段。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录