Universal Vibration Analysis Dataset
收藏arXiv2025-04-16 更新2025-04-18 收录
下载链接:
http://arxiv.org/abs/2504.11581v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由多个公共轴承振动数据集组成,包括CWRU、UORED-VAFCLS、HUST和PADERBORN数据集,目的是创建一个涵盖各种机器类型、运行状态和故障类型的大型振动信号数据集。数据集的初步重点是轴承振动数据,随后将扩展到更多类型的机械和传感器。每个样本都将根据机器类型、运行状态和故障类型进行标记,以适用于监督和非监督学习任务。该数据集旨在成为振动分析的通用资源,适用于制造业、航空航天和能源等行业的预测维护和机械状况监测。
This dataset is composed of multiple public bearing vibration datasets, including CWRU, UORED-VAFCLS, HUST, and PADERBORN datasets. Its core objective is to create a large-scale vibration signal dataset covering various machine types, operating conditions, and fault types. The initial focus of the dataset is on bearing vibration data, and it will subsequently be expanded to more types of machinery and sensors. Each sample will be labeled based on machine type, operating condition, and fault type, making it suitable for both supervised and unsupervised learning tasks. This dataset aims to serve as a universal resource for vibration analysis, applicable to predictive maintenance and mechanical condition monitoring in industries such as manufacturing, aerospace, and energy.
提供机构:
加拿大渥太华大学, 巴西联邦Espírito Santo大学, 巴西Espírito Santo联邦学院
创建时间:
2025-04-16
搜集汇总
数据集介绍

构建方式
Universal Vibration Analysis Dataset的构建采用了多源公开轴承振动数据集融合的策略,以轴承振动信号为切入点,通过整合CWRU、UORED-VAFCLS、HUST和PADERBORN等权威数据集形成基础架构。数据预处理阶段采用标准化时频转换技术,通过汉宁窗短时傅里叶变换生成256×512像素的RGB谱图,设置1600点FFT、96%重叠率和0-10kHz频带范围,确保不同采样率数据的空间对齐。数据集采用分层存储架构VibData,按设备类型、工况状态(正常/内圈故障/外圈故障等)、载荷条件等维度进行结构化标注,并配套开发VibSoft软件层实现数据采样、谱图转换和特征提取的流程标准化。
特点
该数据集的核心特征体现在其工业普适性和多模态融合能力:1) 涵盖4类轴承型号、7种转速工况(600-1800RPM)及复合故障模式,包含健康状态、单点故障和复合故障三类标签体系;2) 独创性地采用时频域谱图作为统一表征形式,既保留原始振动信号的瞬态冲击特征,又解决多源数据采样参数异构问题;3) 配套元数据体系完整记录传感器类型(加速度计/麦克风)、故障严重度(0.007-0.028英寸)、载荷条件(0-3马力)等36维工况参数,支持监督学习与无监督异常检测双范式。特别设计的K折交叉验证方案(K=4)可有效规避载荷条件与故障尺寸的分布偏差,确保模型评估的鲁棒性。
使用方法
该数据集推荐采用迁移学习双阶段框架:1) 预训练阶段使用HUST、UORED-VAFCLS和PADERBORN三源数据,基于DenseNet121架构(批尺寸32,初始学习率0.01)构建通用振动特征提取器;2) 微调阶段提供全微调(更新全部权重)和部分微调(冻结特征层)两种策略,针对目标数据集(如CWRU)采用早停机制和动态学习率衰减(ReduceLROnPlateau)。实验表明,在轴承故障分类任务中,VibNet预训练模型较ImageNet迁移的宏F1值提升7.46%(载荷划分)和13.46%(故障尺寸划分)。用户可通过GitHub开放的vibdata和vibnet-experiments模块实现谱图生成、交叉验证及对比实验的完整复现。
背景与挑战
背景概述
Universal Vibration Analysis Dataset(UVAD)是由Mert Sehri等人于2025年提出的振动分析基准数据集,旨在为预测性维护、结构健康监测等领域的迁移学习研究提供标准化数据支持。该数据集由加拿大渥太华大学与巴西联邦大学等机构联合开发,核心研究聚焦于轴承振动信号的时频表征,通过整合CWRU、UORED-VAFCLS等公开数据集构建初始框架。其创新性体现在采用类ImageNet的架构设计,首次实现了振动分析领域大规模标注数据的系统化组织,为深度学习模型在工业诊断中的泛化性能提升奠定了数据基础。
当前挑战
该数据集面临双重挑战:在领域问题层面,振动信号具有非平稳性、工况依赖性等复杂特性,且正常样本与故障样本比例严重失衡,导致模型泛化能力受限;在构建过程中,需解决多源数据采样率差异(12kHz-64kHz)、传感器异构(加速度计/麦克风)、故障类型标注标准不统一等技术难题。此外,时频转换中窗函数选择、频谱分辨率与时间分辨率的权衡,以及迁移学习时特征空间对齐等问题,均为数据集构建的关键挑战。
常用场景
经典使用场景
Universal Vibration Analysis Dataset(UVAD)作为振动分析领域的基准数据集,其经典应用场景主要集中在机械故障诊断与预测性维护领域。通过整合多源轴承振动数据(如CWRU、UORED-VAFCLS等公开数据集),该数据集为时频域谱图分析提供了标准化输入,支持深度学习模型在轴承内圈/外圈故障、滚动体损伤等典型机械故障的迁移学习任务中实现高精度分类。其分层数据架构(VibData)与模块化处理流程(VibSoft)使得研究者能够快速构建从信号预处理(STFT谱图生成)到模型微调(DenseNet121架构)的完整实验管线。
解决学术问题
该数据集解决了振动分析领域三个核心学术问题:其一,通过融合多工况、多故障类型的轴承振动数据(涵盖0-10kHz共振频段),缓解了小样本条件下模型泛化能力不足的难题;其二,提出的谱图标准化方法(256×512像素RGB/灰度图像)统一了异构传感器的数据表征,克服了传统时域特征提取依赖专家经验的问题;其三,基于迁移学习的预训练-微调范式(如VibNet与ImageNet权重对比实验)验证了跨域知识迁移的可行性,在CWRU负载划分测试中达到97.39%平衡准确率,显著优于从零训练的模型。
衍生相关工作
该数据集衍生出两类代表性研究:方法学层面,催生了基于谱图数据增强的少样本学习(如Wang等人2020年提出的元学习框架)和跨域自适应诊断模型(Zhang等人2024年的特征融合算法);工程应用层面,推动了PHM(Prognostics and Health Management)领域的标准化进程,如Atmaja等人(2024)发布的实验室级振动基准数据集均参照UVAD的元数据规范。其开源框架VibNet-Experiments更成为后续研究(如复合故障诊断、多模态传感器融合)的基础代码库。
以上内容由遇见数据集搜集并总结生成



