five

engine-condition-dataset

收藏
Hugging Face2025-11-11 更新2025-11-12 收录
下载链接:
https://huggingface.co/datasets/dhani10/engine-condition-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含19535行和7列的发动机状态预测二分类数据集。数据集中的列包括发动机转速、润滑油压力、燃油压力、冷却系统压力、润滑油温度、冷却液温度和发动机状态(正常或故障)。该数据集来源于真实的发动机传感器数据,适用于预测维护应用。

This is a binary classification dataset for engine condition prediction, containing 19535 rows and 7 columns. The columns of the dataset include engine speed, lubricating oil pressure, fuel pressure, cooling system pressure, lubricating oil temperature, coolant temperature, and engine condition (normal or faulty). This dataset is sourced from real engine sensor data and is suitable for predictive maintenance applications.
创建时间:
2025-11-06
原始信息汇总

Engine Condition Dataset 概述

数据集简介

二分类数据集,用于基于传感器读数预测发动机状态(0=正常,1=故障)。

数据集信息

  • 数据行数:19,535
  • 数据列数:7
  • 目标变量分布:
    • 0(正常):7,218
    • 1(故障):12,317

数据列说明

  • Engine rpm:发动机每分钟转速
  • Lub oil pressure:润滑油压力(bar)
  • Fuel pressure:燃油系统压力(bar)
  • Coolant pressure:冷却系统压力(bar)
  • lub oil temp:润滑油温度(°C)
  • Coolant temp:冷却液温度(°C)
  • Engine Condition:目标变量(0=正常,1=故障)

数据来源

真实发动机传感器数据,用于预测性维护应用。

搜集汇总
数据集介绍
main_image_url
构建方式
在工业设备监测领域,发动机状态数据集的构建依托真实传感器采集系统,通过持续记录发动机运行时的多维度物理参数实现。该数据集包含19,535条样本,每条数据整合了转速、润滑油压力、燃油压力及冷却系统压力等7项关键指标,并采用二元标注机制将发动机状态划分为正常(0)与故障(1)两类。数据来源基于实际工业场景的连续监测,确保了样本的工程代表性与时序完整性。
特点
该数据集的核心特征体现在其高度结构化的多参数协同记录体系,覆盖热力学与流体力学等关键物理量。样本分布呈现非均衡特性,故障样本占比达63%,反映了工业场景中设备异常状态的天然分布规律。所有传感器数据均采用标准化物理单位,如转速单位RPM、压力单位bar和温度单位摄氏度,这种设计既便于工程人员直观解读,也为特征工程提供了量化基础。
使用方法
针对预测性维护应用场景,该数据集适用于构建基于机器学习的故障诊断模型。研究者可选取前6项传感器参数作为特征向量,发动机状态列作为预测目标,采用分类算法进行训练验证。建议在预处理阶段对非均衡样本采用重采样技术,并通过时序交叉验证评估模型泛化能力。该数据集可直接用于二元分类任务的基准测试,亦可通过特征组合拓展至异常检测等衍生应用。
背景与挑战
背景概述
在工业物联网与预测性维护技术蓬勃发展的背景下,Engine Condition Dataset应运而生,聚焦于发动机健康状态的智能诊断。该数据集由工业数据科学团队构建,旨在通过多源传感器时序数据实现发动机运行状态的二元分类,其核心研究问题在于如何从润滑油压力、冷却液温度等关键参数中准确识别异常工况。作为工业设备预测性维护领域的基准数据集,它为机器学习模型在故障预警、能效优化等应用场景提供了重要数据支撑,推动了智能制造系统的可靠性提升。
当前挑战
该数据集致力于解决工业设备故障预测中传感器数据与故障模式非线性映射的经典难题,具体体现为多参数耦合效应下的异常特征分离困难,以及类别不平衡对模型泛化能力的制约。在构建过程中,面临传感器数据采集同步性保障、工况环境噪声干扰抑制等工程挑战,同时需平衡实时监测需求与数据标注成本间的矛盾,这些因素共同构成了该领域算法研发与落地应用的关键瓶颈。
常用场景
经典使用场景
在工业预测性维护领域,engine-condition-dataset作为发动机状态监测的基准数据集,常被用于构建二分类机器学习模型。通过整合转速、油压、温度等多维传感器时序数据,研究者能够训练模型精准识别发动机的正常与故障状态,为设备健康管理提供关键决策依据。
解决学术问题
该数据集有效解决了机械系统早期故障检测中的模式识别难题,通过可解释的物理参数关联性分析,推动了基于数据驱动的故障诊断理论发展。其均衡的样本分布与多源传感特征,为评估分类算法鲁棒性提供了标准化测试环境,显著提升了工业设备状态预测的学术研究效率。
衍生相关工作
基于该数据集衍生的经典研究包括多模态传感器融合诊断框架的开发,以及时序异常检测算法的创新。部分工作进一步扩展了对抗性样本验证方法,推动了工业人工智能系统在噪声环境下的可靠性研究,为后续的联邦学习等分布式诊断范式奠定了数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作