Welding Defect Dataset|焊接缺陷数据集|质量控制数据集
收藏数据集概述
问题陈述
- 使用ML模型预测焊接缺陷。
- 开发算法使用提供的参数。
- 目标是帮助Godrej Aerospace生产无缺陷产品。
数据集提供
- 参数包括:环境温度、焊接作业温度、湿度、电压电流、焊接速度、保护气体流量、金属成分。
- 机器数据包括焊接者详情。
数据集分析
-
参数相关性:
- 发现电流与电压、温度与湿度之间存在显著相关性。
- 电流与电压的相关性符合欧姆定律(V=IR)。
- 温度与湿度的正相关性是物理现象。
-
焊接作业温度影响:
- 高焊接作业温度可能导致钨夹杂物。
- 建议焊接温度范围为30-60摄氏度。
-
电流和电压影响:
- 高电流导致高热量,增加钨夹杂物的可能性。
- 电压也可能影响钨夹杂物。
-
温度、湿度和流量对气孔的影响:
- 温度和湿度对气孔的影响有限。
- 气孔的平均流量高于无缺陷和钨夹杂物。
-
数据不平衡处理:
- 使用过采样、欠采样和SMOTE技术。
- 结合三种方法创建稳健的数据集。
使用的模型
- 尝试了SVM、Adaboost、决策树、随机森林和梯度提升算法。
- 最终选择XGBoost,达到96%的准确率和良好的F1分数。
模型部署
- 使用Tailwind CSS和Flask服务器部署在AWS EC2上。
- 模型效率高,运行时仅占用30%的1GB RAM,模型大小为35MB。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Amazon Product Data
该数据集包含亚马逊产品的详细信息,包括产品规格、价格、折扣、客户评价和用户评分等字段。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录