five

智能制造业数据库语料库|智能制造数据集|故障检测数据集

收藏
github2022-06-09 更新2024-05-31 收录
智能制造
故障检测
下载链接:
https://github.com/abdalla05/Smart-Manufacturing-Testbed-for-Anomaly-Detection
下载链接
链接失效反馈
资源简介:
该数据集是通过在电机测试台上进行实验,收集不同健康状态下的机器状况数据构建而成。数据包括来自压电和MEMS传感器在不同旋转速度下的加速度信号,用于检测异常和进行转移学习。
创建时间:
2022-06-09
原始信息汇总

数据集说明

数据集概述

本数据集包含四个子数据集,旨在用于智能制造业中的异常检测基准测试。这些数据集鼓励社区在重要领域中标准化异常检测的基准测试,并欢迎社区贡献新的数据集和模型。

数据集详情

(1)-(2) MEMs 和压电数据集

数据集亮点

  • 实验在电机测试台上进行,收集不同健康状况下的机器状态数据。
  • 加速度信号从压电和MEMS传感器同时收集,采样率为3.2 kHz和10 Hz,分别对应X、Y和Z轴。
  • 通过在平衡盘上安装质量,诱导不同级别的机械不平衡,触发故障。
  • 故障条件分为三种可能状态:正常、接近故障和故障。
  • 考虑三种级别的机械不平衡,加速度数据在十种旋转速度(100, 200, 300, 320, 340, 360, 380, 400, 500, 600 RPM)下收集。
  • 在电机运行期间,每种旋转速度下每10秒收集50个样本。

数据集格式

  • 压电和MEMS数据集均为CSV格式。
  • 对于异常检测,有一个RPM的CSV文件;对于迁移学习,每个RPM有多个CSV文件,所有文件压缩在.zip格式中。
  • 每个数据实例(行)包含多个振动传感器的X、Y、Z列。

(3) 过程数据

数据集亮点

  • 开始日期:2021年7月27日
  • 结束日期:2022年3月21日
  • 测量列:空气压力1、空气压力2、冷却器1供应温度、冷却器2供应温度、室外空气温度、室外湿度、室外露点等。
  • 测量间隔:5分钟(每5分钟一个数据点)
  • 描述:从内部安装的传感器收集的SPC数据。

数据集格式

  • 过程数据为CSV格式。
  • CSV文件包含约49K个实例,每个数据实例(行)包含以下列:时间戳、空气压力1、空气压力2、冷却器1供应温度、冷却器2供应温度、室外空气温度、室外湿度、室外露点。

异常日期

  • 观察到机器在2022年2月1日和2022年3月8日出现异常操作。

(4) 制药包装数据

数据集亮点

  • 开始日期:2021年9月13日,12月至1月期间部分数据丢失
  • 结束日期:2022年5月
  • 测量位置:空气压缩机2、冷却器1、冷却器2、Jomar成型机
  • 每个轴的采样率:3.2 kHz
  • 测量间隔:30分钟
  • 测量持续时间:1秒

数据集格式

  • 每个.txt文件表示每天的振动数据。
  • 每次测量的振动数据写入5行:
    • 第1行:测量开始日期和时间
    • 第2行:x轴振动数据(3200个数据点)
    • 第3行:y轴振动数据(3200个数据点)
    • 第4行:z轴振动数据(3200个数据点)
    • 第5行:每个数据点之间的时间差
AI搜集汇总
数据集介绍
main_image_url
构建方式
智能制造业数据库语料库的构建基于实验数据的采集与处理。通过在电机测试平台上进行实验,研究人员收集了不同健康状态下的机器条件数据。实验过程中,分别使用压电传感器和MEMS传感器以3.2 kHz和10 Hz的采样率采集X、Y、Z轴的加速度信号。通过在不同转速下施加机械不平衡来模拟故障状态,数据被分类为正常、接近故障和故障三种状态。此外,数据集还包括了过程数据和制药包装数据,分别通过内部传感器和振动传感器采集,涵盖了空气压力、温度、湿度等多种参数。
特点
该数据集的特点在于其多样性和高精度。数据集涵盖了多个传感器类型和采样率,提供了丰富的振动信号数据,能够有效支持异常检测任务。数据集中包含了不同转速和故障状态下的详细记录,使得研究者能够深入分析机器在不同条件下的行为。此外,数据集还包含了时间序列数据,如过程数据和制药包装数据,这些数据具有较高的时间分辨率,能够捕捉到细微的变化。数据集的结构化格式(如CSV和TXT)也便于数据的读取和处理。
使用方法
使用该数据集时,研究者可以通过提供的代码进行异常检测和迁移学习任务。数据集中的CSV文件可以直接用于训练和测试各种预测模型,如ARIMA、LSTM、AutoEncoder等。对于迁移学习任务,数据集中的多个RPM文件可以用于训练缺陷类型分类器。运行代码时,只需通过命令行执行相应的Python脚本,并指定所需的数据文件。此外,数据集的高采样率和多维度特征使其适用于复杂的时间序列分析和机器学习任务。
背景与挑战
背景概述
智能制造业数据库语料库由多个研究机构联合发布,旨在为智能制造领域的异常检测提供标准化的基准数据。该数据集包含四个子数据集,涵盖了从传感器数据到过程监控的多个方面。数据集的创建时间可追溯至2021年,主要研究人员通过实验收集了不同健康状态下的机器运行数据,特别是通过压电和MEMS传感器采集的振动信号。这些数据不仅为异常检测算法的开发提供了丰富的实验材料,还推动了智能制造领域的数据标准化进程。该数据集的发布对学术界和工业界均产生了深远影响,促进了相关技术的快速发展。
当前挑战
智能制造业数据库语料库在构建和应用过程中面临多重挑战。首先,异常检测领域本身具有高度复杂性,尤其是在多传感器数据融合和实时监控场景下,如何准确识别异常状态成为核心难题。其次,数据集的构建过程中,研究人员需克服数据采集的高频采样、多维度数据同步以及噪声干扰等技术障碍。此外,数据集的多样性和规模也对算法的泛化能力提出了更高要求。最后,如何在工业环境中实现数据的高效传输和存储,也是该领域亟待解决的关键问题。这些挑战不仅推动了相关技术的发展,也为未来的研究指明了方向。
常用场景
经典使用场景
智能制造业数据库语料库广泛应用于智能制造领域的异常检测研究。通过整合多种传感器数据,该数据集为研究人员提供了一个标准化的平台,用于开发和测试各种异常检测算法。经典的使用场景包括利用ARIMA、LSTM、AutoEncoder等模型对机械设备的振动数据进行分析,以预测和识别潜在的故障状态。
解决学术问题
该数据集解决了智能制造领域中异常检测算法缺乏标准化基准的问题。通过提供多源传感器数据和明确的故障分类,研究人员能够更准确地评估和比较不同算法的性能。这不仅推动了异常检测技术的发展,还为智能制造系统的可靠性和安全性提供了理论支持。
衍生相关工作
基于该数据集,许多经典的研究工作得以展开。例如,研究人员开发了基于深度学习的异常检测模型,如DeepAR和DeepFactors,这些模型在预测设备故障方面表现出色。此外,迁移学习技术的应用也取得了显著进展,通过预训练模型在不同设备间的知识迁移,进一步提升了异常检测的准确性和泛化能力。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

ISIC 2018

ISIC 2018数据集包含2594张皮肤病变图像,用于皮肤癌检测任务。数据集分为训练集、验证集和测试集,每张图像都附有详细的元数据,包括病变类型、患者年龄、性别和解剖部位等信息。

challenge2018.isic-archive.com 收录

UAV123

从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。

OpenDataLab 收录