ai4i 2020 predictive maintenance dataset

github2025-01-02 更新2025-01-14 收录

下载链接：

https://github.com/sushantdhumak/Machine-Learning-for-Predictive-Maintenance

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集反映了工业中遇到的真实预测性维护情况，包含来自实际设备的测量数据。特征描述直接取自数据集来源。

This dataset captures real-world predictive maintenance scenarios encountered in industrial contexts, and comprises measurement data collected from actual industrial equipment. The feature descriptions are directly sourced from the original source of the dataset.

创建时间：

2025-01-02

原始信息汇总

数据集概述

数据集名称

Machine Learning for Predictive Maintenance

数据集来源

UCI Machine Learning Repository

数据集描述

该数据集反映了工业中遇到的真实预测性维护场景，包含来自真实设备的测量数据。特征描述直接取自数据集源。

特征变量

Air temperature [K]: 使用随机游走过程生成，随后标准化为围绕300 K的标准差为2 K。
Process temperature [K]: 使用随机游走过程生成，标准化为1 K的标准差，并添加到空气温度上再加10 K。
Rotational speed [rpm]: 从2860 W的功率计算得出，叠加了正态分布的噪声。
Torque [Nm]: 扭矩值围绕40 Nm正态分布，标准差为10 Nm，且无负值。
Tool wear [min]: 质量变体H/M/L分别为使用的工具增加了5/3/2分钟的磨损时间。

目标变量

Machine failure: 故障或无故障（用于二分类）。
Failure Type: 故障类型（用于多分类）。

故障类型

Tool wear failure (TWF): 工具在故障时将被更换。
Heat dissipation failure (HDF): 散热导致过程故障。
Power failure (PWF): 扭矩和旋转速度（以rad/s为单位）的乘积等于过程所需的功率。
Overstrain failure (OSF): 过载故障。
Random failures (RNF): 每个过程有0.1%的几率发生故障，无论其过程参数如何。

附加变量

UID: 唯一标识符，范围从1到10000。
Product ID: 由字母L、M或H组成，分别代表低（50%的产品）、中（30%）和高（20%）质量变体，以及变体特定的序列号。

搜集汇总

数据集介绍

构建方式

该数据集通过模拟工业设备运行中的真实测量数据构建而成，涵盖了空气温度、过程温度、旋转速度、扭矩和工具磨损等多个关键特征变量。空气温度和过程温度通过随机游走过程生成，并分别围绕300K和310K进行标准化处理。旋转速度基于2860W的功率计算，并叠加了正态分布的噪声。扭矩值则以40Nm为中心，标准差为10Nm的正态分布生成。工具磨损则根据产品质量等级（高、中、低）分别增加不同的磨损时间。

使用方法

该数据集可用于开发和评估预测性维护模型。研究人员可以通过分析空气温度、过程温度、旋转速度、扭矩和工具磨损等特征变量，预测设备是否会发生故障以及故障的具体类型。数据集中的二元分类标签可用于训练二分类模型，而多分类标签则适用于多分类问题的研究。此外，数据集中的唯一标识符和产品ID可用于进一步的数据分析和模型优化。通过该数据集，研究人员能够深入理解设备故障的成因，并开发出更高效的预测性维护算法。

背景与挑战

背景概述

ai4i 2020预测性维护数据集由工业界真实设备测量数据构成，旨在为预测性维护领域提供高质量的研究资源。该数据集由ai4i团队于2020年发布，其核心研究问题聚焦于通过机器学习方法预测工业设备的故障类型与发生时间，从而优化设备维护策略，减少停机时间和维护成本。数据集涵盖了空气温度、过程温度、转速、扭矩和工具磨损等关键特征变量，以及机器故障类型等目标变量。该数据集的发布为工业4.0背景下的设备健康管理研究提供了重要支持，推动了预测性维护技术的实际应用与发展。

当前挑战

ai4i 2020数据集在解决预测性维护问题时面临多重挑战。首先，工业设备的故障类型多样且复杂，如何从多维度特征中准确识别故障模式是一个关键难题。其次，数据集中包含的随机噪声和随机故障增加了模型训练的难度，要求算法具备较强的鲁棒性。此外，构建过程中需确保数据的真实性和代表性，同时平衡不同故障类型的样本分布，以避免模型偏差。这些挑战不仅考验数据集的构建质量，也对后续机器学习算法的设计与优化提出了更高要求。

常用场景

经典使用场景

在工业预测性维护领域，ai4i 2020预测性维护数据集被广泛应用于模拟和预测设备故障。通过分析设备运行过程中的温度、转速、扭矩等关键参数，研究人员能够构建机器学习模型，预测设备可能发生的故障类型和时间，从而提前进行维护，避免生产中断。

解决学术问题

该数据集解决了工业设备故障预测中的关键问题，如如何从复杂的设备运行数据中提取有效特征，以及如何通过机器学习模型实现高精度的故障分类。这不仅推动了预测性维护技术的发展，还为工业设备的智能化管理提供了理论支持。

实际应用

在实际应用中，ai4i 2020数据集被用于优化制造流程中的设备维护策略。通过实时监控设备状态并预测潜在故障，企业能够显著减少设备停机时间，提高生产效率，降低维护成本。这一应用在汽车制造、航空航天等高精度制造领域尤为重要。

数据集最近研究