Lab-scale Vibration Analysis Dataset
收藏arXiv2022-12-27 更新2024-06-21 收录
下载链接:
https://zenodo.org/record/7006575
下载链接
链接失效反馈官方服务:
资源简介:
Lab-scale Vibration Analysis Dataset是由印度尼西亚十胜日立科学技术研究所创建的,包含4000条来自实验室规模机器的振动信号数据。该数据集涵盖四种不同的机器状态:正常、不平衡、错位和轴承故障。数据集通过CSV文件格式提供,旨在支持机器学习在机器故障诊断中的应用,特别是通过振动分析进行预测性维护。该数据集的创建旨在填补现有振动分析数据集的空白,并提供一个基准,以评估和支持机器学习方法在机器状态监测中的应用。
Lab-scale Vibration Analysis Dataset was developed by Hitachi Tokachi Indonesia Institute of Science and Technology. It contains 4000 entries of vibration signal data collected from lab-scale machinery. This dataset covers four distinct machine conditions: normal, unbalanced, misaligned, and bearing fault. The dataset is provided in CSV format, aiming to support the application of machine learning in machine fault diagnosis, especially for predictive maintenance via vibration analysis. This dataset was created to fill the gap in existing vibration analysis datasets and serve as a benchmark for evaluating and supporting the application of machine learning methods in machine condition monitoring.
提供机构:
十胜日立科学技术研究所
创建时间:
2022-12-27
搜集汇总
数据集介绍

构建方式
本数据集通过实验室环境中的电动泵收集振动信号,以模拟四种常见机器运行状态:正常、不平衡、不对中和轴承故障。通过在叶轮上添加不同质量的配重模拟不平衡状态,通过耦合轴与额外金属圆柱模拟不对中状态,通过锤击轴承外环模拟轴承故障。振动传感器安装在机器的刚性部分并靠近振动源,以记录三轴加速度数据。数据以CSV格式提供,便于研究人员下载和使用。
特点
本数据集的特点在于其平衡性,每个机器状态均包含1000个样本。数据集包含了四种不同的机器状态:正常、不平衡、不对中和轴承故障。通过使用支持向量机(SVM)、K最近邻(KNN)和高斯朴素贝叶斯(GNB)三种机器学习算法进行评估,结果表明SVM在5折交叉验证中取得了99.75%的加权准确率。此外,数据集的构建和实验设计在实验室环境下进行,有助于控制变量并验证新设计或技术的性能。
使用方法
使用本数据集的方法包括以下步骤:首先,从CSV文件中读取振动数据;其次,对数据进行预处理,包括快速傅里叶变换(FFT)和归一化;然后,提取特征,如均值、标准差、均方根(RMS)、峰峰值、脉冲因子、偏度、峰度、峰度因子和形状因子;最后,使用机器学习算法,如SVM、KNN或GNB,对提取的特征进行训练和测试,以预测机器的状态。研究者可以根据需要调整参数和算法,以优化模型性能。
背景与挑战
背景概述
在制造业中,对机器运行状态的监控对于保证生产至关重要。机器的突发故障可能导致生产中断和收入损失。机器的振动信号是其状态的良好指标。本文介绍了一个实验室规模的机器振动信号数据集,该数据集包含四种不同的机器状态:正常、不平衡、不对中和轴承故障。三种机器学习方法(SVM、KNN和GNB)对数据集进行了评估,其中一种方法在1折测试中取得了完美的结果。算法的性能使用加权准确率(WA)进行评估,因为数据是平衡的。结果表明,性能最好的算法是SVM,在5折交叉验证中加权准确率为99.75%。数据集以CSV文件的形式提供,并在一个开放和免费的存储库中提供。
当前挑战
振动分析技术目前在许多方面存在不足。大数据的需求具有挑战性,并且可能难以处理真实机器(处理不同状态的机器)。振动分析的准确性和可靠性取决于所使用的传感器和测量设备的质量。振动分析需要专业知识来解释数据并识别潜在问题。此外,振动分析可能由于需要专用设备和软件而变得昂贵。本文旨在解决振动分析的局限性。
常用场景
经典使用场景
该数据集经典的使用场景是对机器的振动信号进行分析,从而实现机器状态的监测和故障诊断。通过对机器振动信号的特征提取和机器学习模型的训练,可以有效地识别机器的正常状态、不平衡、不对中和轴承故障等四种不同状态。这对于工业生产中的预测性维护具有重要意义,可以帮助企业及时发现并解决机器故障,避免因机器故障导致的停工和收入损失。
解决学术问题
该数据集解决了振动分析中数据获取困难、分析准确性和可靠性依赖于传感器和测量设备的质量、分析过程需要专业知识等问题。通过使用机器学习技术,可以有效地识别机器状态,无需专业知识,且具有较高的准确性和可靠性。同时,该数据集为振动分析研究提供了免费的数据集,填补了现有数据集的空白,为振动分析研究提供了便利。
衍生相关工作
该数据集衍生了关于机器学习在振动分析中的应用、机器状态监测和故障诊断等方面的相关研究。通过使用机器学习技术,可以有效地识别机器状态,无需专业知识,且具有较高的准确性和可靠性。同时,该数据集也为振动分析研究提供了免费的数据集,填补了现有数据集的空白,为振动分析研究提供了便利。
以上内容由遇见数据集搜集并总结生成



