five

ai4i 2020 predictive maintenance dataset|预测性维护数据集|工业设备数据集

收藏
github2025-01-02 更新2025-01-14 收录
预测性维护
工业设备
下载链接:
https://github.com/sushantdhumak/Machine-Learning-for-Predictive-Maintenance
下载链接
链接失效反馈
资源简介:
该数据集反映了工业中遇到的真实预测性维护情况,包含来自实际设备的测量数据。特征描述直接取自数据集来源。
创建时间:
2025-01-02
原始信息汇总

数据集概述

数据集名称

Machine Learning for Predictive Maintenance

数据集来源

UCI Machine Learning Repository

数据集描述

该数据集反映了工业中遇到的真实预测性维护场景,包含来自真实设备的测量数据。特征描述直接取自数据集源。

特征变量

  • Air temperature [K]: 使用随机游走过程生成,随后标准化为围绕300 K的标准差为2 K。
  • Process temperature [K]: 使用随机游走过程生成,标准化为1 K的标准差,并添加到空气温度上再加10 K。
  • Rotational speed [rpm]: 从2860 W的功率计算得出,叠加了正态分布的噪声。
  • Torque [Nm]: 扭矩值围绕40 Nm正态分布,标准差为10 Nm,且无负值。
  • Tool wear [min]: 质量变体H/M/L分别为使用的工具增加了5/3/2分钟的磨损时间。

目标变量

  • Machine failure: 故障或无故障(用于二分类)。
  • Failure Type: 故障类型(用于多分类)。

故障类型

  • Tool wear failure (TWF): 工具在故障时将被更换。
  • Heat dissipation failure (HDF): 散热导致过程故障。
  • Power failure (PWF): 扭矩和旋转速度(以rad/s为单位)的乘积等于过程所需的功率。
  • Overstrain failure (OSF): 过载故障。
  • Random failures (RNF): 每个过程有0.1%的几率发生故障,无论其过程参数如何。

附加变量

  • UID: 唯一标识符,范围从1到10000。
  • Product ID: 由字母L、M或H组成,分别代表低(50%的产品)、中(30%)和高(20%)质量变体,以及变体特定的序列号。
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过模拟工业设备运行中的真实测量数据构建而成,涵盖了空气温度、过程温度、旋转速度、扭矩和工具磨损等多个关键特征变量。空气温度和过程温度通过随机游走过程生成,并分别围绕300K和310K进行标准化处理。旋转速度基于2860W的功率计算,并叠加了正态分布的噪声。扭矩值则以40Nm为中心,标准差为10Nm的正态分布生成。工具磨损则根据产品质量等级(高、中、低)分别增加不同的磨损时间。
使用方法
该数据集可用于开发和评估预测性维护模型。研究人员可以通过分析空气温度、过程温度、旋转速度、扭矩和工具磨损等特征变量,预测设备是否会发生故障以及故障的具体类型。数据集中的二元分类标签可用于训练二分类模型,而多分类标签则适用于多分类问题的研究。此外,数据集中的唯一标识符和产品ID可用于进一步的数据分析和模型优化。通过该数据集,研究人员能够深入理解设备故障的成因,并开发出更高效的预测性维护算法。
背景与挑战
背景概述
ai4i 2020预测性维护数据集由工业界真实设备测量数据构成,旨在为预测性维护领域提供高质量的研究资源。该数据集由ai4i团队于2020年发布,其核心研究问题聚焦于通过机器学习方法预测工业设备的故障类型与发生时间,从而优化设备维护策略,减少停机时间和维护成本。数据集涵盖了空气温度、过程温度、转速、扭矩和工具磨损等关键特征变量,以及机器故障类型等目标变量。该数据集的发布为工业4.0背景下的设备健康管理研究提供了重要支持,推动了预测性维护技术的实际应用与发展。
当前挑战
ai4i 2020数据集在解决预测性维护问题时面临多重挑战。首先,工业设备的故障类型多样且复杂,如何从多维度特征中准确识别故障模式是一个关键难题。其次,数据集中包含的随机噪声和随机故障增加了模型训练的难度,要求算法具备较强的鲁棒性。此外,构建过程中需确保数据的真实性和代表性,同时平衡不同故障类型的样本分布,以避免模型偏差。这些挑战不仅考验数据集的构建质量,也对后续机器学习算法的设计与优化提出了更高要求。
常用场景
经典使用场景
在工业预测性维护领域,ai4i 2020预测性维护数据集被广泛应用于模拟和预测设备故障。通过分析设备运行过程中的温度、转速、扭矩等关键参数,研究人员能够构建机器学习模型,预测设备可能发生的故障类型和时间,从而提前进行维护,避免生产中断。
解决学术问题
该数据集解决了工业设备故障预测中的关键问题,如如何从复杂的设备运行数据中提取有效特征,以及如何通过机器学习模型实现高精度的故障分类。这不仅推动了预测性维护技术的发展,还为工业设备的智能化管理提供了理论支持。
实际应用
在实际应用中,ai4i 2020数据集被用于优化制造流程中的设备维护策略。通过实时监控设备状态并预测潜在故障,企业能够显著减少设备停机时间,提高生产效率,降低维护成本。这一应用在汽车制造、航空航天等高精度制造领域尤为重要。
数据集最近研究
最新研究方向
近年来,随着工业4.0和智能制造的快速发展,预测性维护(Predictive Maintenance)在工业设备管理中的应用日益广泛。ai4i 2020预测性维护数据集作为该领域的重要资源,为研究人员提供了丰富的设备运行数据,涵盖了空气温度、过程温度、转速、扭矩和刀具磨损等多个关键特征。当前的研究方向主要集中在利用机器学习算法对设备故障进行精确预测和分类,尤其是针对不同类型的故障(如刀具磨损故障、散热故障、电力故障等)进行多分类研究。此外,结合深度学习和强化学习技术,探索更高效的故障预测模型,已成为该领域的前沿热点。该数据集的应用不仅有助于提高设备的运行效率,还能显著降低维护成本,对推动工业智能化进程具有重要的现实意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

HyperGlobal-450K - 全球最大规模高光谱图像数据集

HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

github 收录