engine-condition-data

Hugging Face2026-03-29 更新2026-03-30 收录

下载链接：

https://huggingface.co/datasets/vnsonly05/engine-condition-data

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含发动机运行状态的监测数据，由7个数值型特征组成：发动机转速（Engine rpm）、润滑油压力（Lub oil pressure）、燃油压力（Fuel pressure）、冷却液压力（Coolant pressure）、润滑油温度（lub oil temp）、冷却液温度（Coolant temp）以及发动机状态标签（Engine Condition）。数据集总规模为19,535条样本，分为训练集（15,628条）和测试集（3,907条），文件总大小约1.09MB。数据以结构化格式存储，适用于发动机状态监测、故障预测等工业设备维护场景。

创建时间：

2026-03-15

原始信息汇总

数据集概述

基本信息

数据集名称: engine-condition-data
托管平台: Hugging Face Datasets
数据集地址: https://huggingface.co/datasets/vnsonly05/engine-condition-data

数据集结构

特征列

Engine rpm: 数据类型为 int64
Lub oil pressure: 数据类型为 float64
Fuel pressure: 数据类型为 float64
Coolant pressure: 数据类型为 float64
lub oil temp: 数据类型为 float64
Coolant temp: 数据类型为 float64
Engine Condition: 数据类型为 int64

数据划分

训练集 (train):
- 样本数量: 19535
- 文件大小: 1093960 字节
测试集 (test):
- 样本数量: 3907
- 文件大小: 218792 字节

数据文件

配置文件名称: default
训练集文件路径: data/train-*
测试集文件路径: data/test-*

存储信息

下载大小: 3019272 字节
数据集大小: 1312752 字节

搜集汇总

数据集介绍

构建方式

在工业监测与预测性维护领域，发动机状态数据集的构建依托于实际运行环境中的传感器采集。该数据集通过记录发动机在多种工况下的关键参数，如转速、润滑油压力、燃油压力、冷却液压力及温度等，形成了涵盖训练集与测试集的完整样本。数据采集过程注重时序连续性与工况多样性，确保了样本能够反映发动机从正常到异常状态的动态演变，为模型训练提供了真实且丰富的环境。

特点

本数据集以多维传感器数据为核心特征，涵盖了发动机运行中的物理参数与状态标签。每个样本包含七项关键指标，其中发动机状态以整数编码标识，便于分类任务处理。数据集规模适中，训练集与测试集划分明确，支持监督学习框架下的模型开发与评估。其结构化特征与清晰的标签设计，为机器学习算法在故障诊断与健康管理中的应用提供了坚实基础。

使用方法

使用者可借助该数据集开展发动机状态分类或异常检测研究。通过加载训练集进行模型训练，利用测试集验证模型性能，能够评估算法在真实工业数据上的泛化能力。数据集适用于传统机器学习方法或深度学习模型，如支持向量机、随机森林或神经网络，以探索发动机健康状态的预测与诊断策略。

背景与挑战

背景概述

发动机状态监测是工业物联网与预测性维护领域的关键研究方向，旨在通过实时采集的传感器数据评估发动机的健康状况。Engine-condition-data数据集由相关研究机构构建，聚焦于多参数时序数据的分析，其核心研究问题在于如何从转速、油压、燃油压力、冷却液压力与温度等多元特征中，精准识别发动机的异常状态或性能退化趋势。该数据集的建立为故障诊断与剩余使用寿命预测模型提供了实证基础，推动了智能维护系统从理论向工程应用的跨越，对提升工业设备的可靠性与运行效率具有显著影响力。

当前挑战

该数据集致力于解决发动机故障诊断与健康管理中的复杂挑战，其核心难点在于多传感器数据的高维性、时序相关性以及噪声干扰，这些因素使得异常模式往往隐藏在正常工况的细微波动中，对模型的鲁棒性与泛化能力提出了严峻考验。在构建过程中，挑战主要体现于传感器数据的同步采集与校准，需确保不同物理量在时间维度上的一致性；同时，发动机状态标签的标注依赖于专业领域知识，如何基于实际运行日志或故障记录生成准确、可靠的监督信号，亦是数据质量保障的关键环节。

常用场景

经典使用场景

在机械工程与预测性维护领域，发动机状态数据集常被用于构建故障诊断与健康管理模型。该数据集通过整合转速、润滑油压力、燃油压力、冷却液压力与温度等多维传感器时序数据，为机器学习算法提供了丰富的特征空间。研究人员通常利用监督学习方法，如支持向量机或深度学习网络，训练分类器以识别发动机的正常与异常运行状态，从而实现早期故障预警。

解决学术问题

该数据集有效解决了工业设备状态监测中数据稀缺与标注困难的核心挑战。它提供了标准化的多参数传感器读数与对应状态标签，使学者能够系统评估不同算法在复杂工况下的泛化能力与鲁棒性。其意义在于推动了故障诊断领域从基于规则的方法向数据驱动范式的转变，为构建可解释、高精度的预测模型奠定了实证基础，显著提升了学术研究的可复现性与可比性。

衍生相关工作

围绕该数据集，学术界衍生了一系列经典研究工作，包括基于时序卷积网络的异常检测框架、融合注意力机制的故障分类模型，以及利用迁移学习解决数据分布差异的跨域诊断方法。这些工作不仅深化了对多变量传感器数据耦合关系的理解，还促进了健康预测与剩余使用寿命估计等前沿方向的交叉融合，持续推动着智能维护技术体系的演进与完善。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集