five

智能制造业数据库语料库

收藏
github2022-06-09 更新2024-05-31 收录
下载链接:
https://github.com/abdalla05/Smart-Manufacturing-Testbed-for-Anomaly-Detection
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过在电机测试台上进行实验,收集不同健康状态下的机器状况数据构建而成。数据包括来自压电和MEMS传感器在不同旋转速度下的加速度信号,用于检测异常和进行转移学习。

This dataset was constructed via experiments carried out on a motor test bench, by collecting machine condition data under different health states. The data encompasses acceleration signals collected by piezoelectric and MEMS sensors across various rotational speeds, which are utilized for anomaly detection and transfer learning.
创建时间:
2022-06-09
原始信息汇总

数据集说明

数据集概述

本数据集包含四个子数据集,旨在用于智能制造业中的异常检测基准测试。这些数据集鼓励社区在重要领域中标准化异常检测的基准测试,并欢迎社区贡献新的数据集和模型。

数据集详情

(1)-(2) MEMs 和压电数据集

数据集亮点

  • 实验在电机测试台上进行,收集不同健康状况下的机器状态数据。
  • 加速度信号从压电和MEMS传感器同时收集,采样率为3.2 kHz和10 Hz,分别对应X、Y和Z轴。
  • 通过在平衡盘上安装质量,诱导不同级别的机械不平衡,触发故障。
  • 故障条件分为三种可能状态:正常、接近故障和故障。
  • 考虑三种级别的机械不平衡,加速度数据在十种旋转速度(100, 200, 300, 320, 340, 360, 380, 400, 500, 600 RPM)下收集。
  • 在电机运行期间,每种旋转速度下每10秒收集50个样本。

数据集格式

  • 压电和MEMS数据集均为CSV格式。
  • 对于异常检测,有一个RPM的CSV文件;对于迁移学习,每个RPM有多个CSV文件,所有文件压缩在.zip格式中。
  • 每个数据实例(行)包含多个振动传感器的X、Y、Z列。

(3) 过程数据

数据集亮点

  • 开始日期:2021年7月27日
  • 结束日期:2022年3月21日
  • 测量列:空气压力1、空气压力2、冷却器1供应温度、冷却器2供应温度、室外空气温度、室外湿度、室外露点等。
  • 测量间隔:5分钟(每5分钟一个数据点)
  • 描述:从内部安装的传感器收集的SPC数据。

数据集格式

  • 过程数据为CSV格式。
  • CSV文件包含约49K个实例,每个数据实例(行)包含以下列:时间戳、空气压力1、空气压力2、冷却器1供应温度、冷却器2供应温度、室外空气温度、室外湿度、室外露点。

异常日期

  • 观察到机器在2022年2月1日和2022年3月8日出现异常操作。

(4) 制药包装数据

数据集亮点

  • 开始日期:2021年9月13日,12月至1月期间部分数据丢失
  • 结束日期:2022年5月
  • 测量位置:空气压缩机2、冷却器1、冷却器2、Jomar成型机
  • 每个轴的采样率:3.2 kHz
  • 测量间隔:30分钟
  • 测量持续时间:1秒

数据集格式

  • 每个.txt文件表示每天的振动数据。
  • 每次测量的振动数据写入5行:
    • 第1行:测量开始日期和时间
    • 第2行:x轴振动数据(3200个数据点)
    • 第3行:y轴振动数据(3200个数据点)
    • 第4行:z轴振动数据(3200个数据点)
    • 第5行:每个数据点之间的时间差
搜集汇总
数据集介绍
main_image_url
构建方式
智能制造业数据库语料库的构建基于实验数据的采集与处理。通过在电机测试平台上进行实验,研究人员收集了不同健康状态下的机器条件数据。实验过程中,分别使用压电传感器和MEMS传感器以3.2 kHz和10 Hz的采样率采集X、Y、Z轴的加速度信号。通过在不同转速下施加机械不平衡来模拟故障状态,数据被分类为正常、接近故障和故障三种状态。此外,数据集还包括了过程数据和制药包装数据,分别通过内部传感器和振动传感器采集,涵盖了空气压力、温度、湿度等多种参数。
特点
该数据集的特点在于其多样性和高精度。数据集涵盖了多个传感器类型和采样率,提供了丰富的振动信号数据,能够有效支持异常检测任务。数据集中包含了不同转速和故障状态下的详细记录,使得研究者能够深入分析机器在不同条件下的行为。此外,数据集还包含了时间序列数据,如过程数据和制药包装数据,这些数据具有较高的时间分辨率,能够捕捉到细微的变化。数据集的结构化格式(如CSV和TXT)也便于数据的读取和处理。
使用方法
使用该数据集时,研究者可以通过提供的代码进行异常检测和迁移学习任务。数据集中的CSV文件可以直接用于训练和测试各种预测模型,如ARIMA、LSTM、AutoEncoder等。对于迁移学习任务,数据集中的多个RPM文件可以用于训练缺陷类型分类器。运行代码时,只需通过命令行执行相应的Python脚本,并指定所需的数据文件。此外,数据集的高采样率和多维度特征使其适用于复杂的时间序列分析和机器学习任务。
背景与挑战
背景概述
智能制造业数据库语料库由多个研究机构联合发布,旨在为智能制造领域的异常检测提供标准化的基准数据。该数据集包含四个子数据集,涵盖了从传感器数据到过程监控的多个方面。数据集的创建时间可追溯至2021年,主要研究人员通过实验收集了不同健康状态下的机器运行数据,特别是通过压电和MEMS传感器采集的振动信号。这些数据不仅为异常检测算法的开发提供了丰富的实验材料,还推动了智能制造领域的数据标准化进程。该数据集的发布对学术界和工业界均产生了深远影响,促进了相关技术的快速发展。
当前挑战
智能制造业数据库语料库在构建和应用过程中面临多重挑战。首先,异常检测领域本身具有高度复杂性,尤其是在多传感器数据融合和实时监控场景下,如何准确识别异常状态成为核心难题。其次,数据集的构建过程中,研究人员需克服数据采集的高频采样、多维度数据同步以及噪声干扰等技术障碍。此外,数据集的多样性和规模也对算法的泛化能力提出了更高要求。最后,如何在工业环境中实现数据的高效传输和存储,也是该领域亟待解决的关键问题。这些挑战不仅推动了相关技术的发展,也为未来的研究指明了方向。
常用场景
经典使用场景
智能制造业数据库语料库广泛应用于智能制造领域的异常检测研究。通过整合多种传感器数据,该数据集为研究人员提供了一个标准化的平台,用于开发和测试各种异常检测算法。经典的使用场景包括利用ARIMA、LSTM、AutoEncoder等模型对机械设备的振动数据进行分析,以预测和识别潜在的故障状态。
解决学术问题
该数据集解决了智能制造领域中异常检测算法缺乏标准化基准的问题。通过提供多源传感器数据和明确的故障分类,研究人员能够更准确地评估和比较不同算法的性能。这不仅推动了异常检测技术的发展,还为智能制造系统的可靠性和安全性提供了理论支持。
衍生相关工作
基于该数据集,许多经典的研究工作得以展开。例如,研究人员开发了基于深度学习的异常检测模型,如DeepAR和DeepFactors,这些模型在预测设备故障方面表现出色。此外,迁移学习技术的应用也取得了显著进展,通过预训练模型在不同设备间的知识迁移,进一步提升了异常检测的准确性和泛化能力。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务