five

bethcherie/CWRU_baseline

收藏
Hugging Face2024-07-19 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/bethcherie/CWRU_baseline
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个配置文件,分别对应基线数据、内圈故障数据、外圈故障数据和球故障数据。每个配置文件对应一个CSV文件,文件结构显示了数据集包含四个CSV文件,分别存储不同类型的数据。

The dataset contains four configurations corresponding to baseline data, inner race fault data, outer race fault data, and ball fault data. Each configuration corresponds to a CSV file, and the file structure shows that the dataset includes four CSV files storing different types of data.
提供机构:
bethcherie
原始信息汇总

数据集概述

许可证

  • MIT许可证

语言

  • 英语

配置

  • Baseline: 对应的数据文件为 baselineArray.csv
  • Inner Race: 对应的数据文件为 InnerRaceFaultArray.csv
  • Outer Race: 对应的数据文件为 OuterRaceFaultArray.csv
  • Ball: 对应的数据文件为 BallFaultArray.csv

文件结构

  • README.md
  • baselineArray.csv
  • InnerRaceFaultArray.csv
  • OuterRaceFaultArray.csv
  • BallFaultArray.csv
搜集汇总
数据集介绍
main_image_url
构建方式
在旋转机械故障诊断领域,基准数据集对于算法验证与比较至关重要。CWRU_baseline数据集源自凯斯西储大学轴承数据中心,通过精心设计的实验采集振动信号。该数据集以配置形式组织,包含Baseline、Inner Race、Outer Race及Ball四个子集,分别对应正常状态及内圈、外圈、滚动体故障。每个子集以CSV文件存储,其中baselineArray.csv作为基准对照,其余文件编码特定故障类型的振动数据。这种模块化构建方式确保了数据结构的清晰性与可扩展性,便于研究者针对不同故障模式进行精准分析。
特点
该数据集的核心特点在于其标准化的故障模拟与均衡的样本分布。每个配置下的CSV文件均包含高保真振动信号,采样频率与工况条件严格统一,消除了环境差异带来的干扰。Baseline子集提供健康状态参考,而三类故障数据覆盖了轴承主要失效模式,形成完整的诊断图谱。数据格式简洁,无需复杂预处理即可直接用于机器学习模型输入,显著降低了使用门槛。此外,MIT许可证的开放授权使得该数据集在学术界与工业界均可自由传播与复用。
使用方法
使用CWRU_baseline数据集时,研究人员可通过HuggingFace Datasets库按配置名称加载特定子集,例如调用load_dataset('bethcherie/CWRU_baseline', 'Inner Race')获取内圈故障数据。每个CSV文件包含时间序列振动幅值,可直接用于特征提取、分类模型训练或迁移学习实验。建议将健康状态数据与故障数据配对,构建二分类或多分类任务。数据集支持Python环境下的快速迭代,配合常见库如NumPy与scikit-learn,即可开展从信号处理到模式识别的全流程研究,极大便利了故障诊断算法的开发与基准测试。
背景与挑战
背景概述
该数据集源自美国凯斯西储大学(Case Western Reserve University, CWRU)轴承数据中心,是旋转机械故障诊断领域最具权威性的基准数据集之一。自20世纪90年代末发布以来,CWRU数据集已成为评估滚动轴承故障检测与分类算法性能的标准参考。数据集通过精密实验平台采集了正常状态及内圈、外圈、滚动体三种典型故障下的振动信号,为研究基于信号处理的故障特征提取与模式识别方法提供了可靠基础。其核心研究问题在于如何从高噪声、非平稳的振动信号中准确识别故障类型与严重程度,推动了机器学习在工业设备健康管理中的广泛应用。该数据集对相关领域的影响力深远,至今仍是验证新型诊断模型(如深度学习、迁移学习)有效性的首要选择。
当前挑战
该数据集所解决的领域问题聚焦于旋转机械的智能故障诊断,核心挑战包括:1)信号非平稳性与强噪声干扰,使得故障特征易被背景噪声淹没;2)不同故障类型及严重程度间的特征重叠,导致分类边界模糊;3)构建过程中需在恒定转速与多负载条件下同步采集高保真振动数据,并人工引入精确尺寸的故障以控制变量。此外,数据集的长期挑战在于其局限性:实验室环境下的理想化条件(如单一转速、恒定负载)无法完全模拟工业现场的多变工况,且样本规模有限,易导致模型过拟合。因此,现代研究常需结合数据增强、域自适应等技术,以提升跨工况泛化能力。
常用场景
经典使用场景
在旋转机械故障诊断领域,CWRU_baseline数据集作为凯斯西储大学轴承数据中心的经典基准资源,常被用于构建和验证基于振动信号的故障分类模型。研究者通常利用其提供的正常状态与内圈、外圈、滚动体三类故障工况下的时域波形数据,训练深度学习或机器学习算法,以识别不同故障类型及严重程度。该数据集以其标准化的采集条件和明确的故障标签,成为对比不同诊断方法性能的基石。
衍生相关工作
基于CWRU_baseline数据集,衍生出大量经典工作,包括深度卷积神经网络(CNN)用于端到端故障分类、生成对抗网络(GAN)用于数据增强以缓解类别不平衡、以及域自适应方法解决跨工况迁移诊断问题。例如,文献中广泛引用的“WDCNN”模型和“TICNN”架构均以此数据集验证其有效性。这些工作不仅提升了诊断精度,还奠定了智能故障诊断领域的方法论基础。
数据集最近研究
最新研究方向
基于CWRU_Baseline数据集的故障诊断研究正逐步从传统机器学习方法向深度学习与迁移学习范式演进。该数据集作为旋转机械故障诊断领域的基准,涵盖了正常状态与内圈、外圈及滚动体三类典型故障的振动信号。当前前沿方向聚焦于利用卷积神经网络与注意力机制自动提取多尺度故障特征,同时结合领域自适应技术解决跨工况、跨设备的数据分布漂移问题。此外,生成对抗网络被用于数据增强以缓解样本不平衡,而图神经网络则被探索用于建模传感器间的空间关联。这些研究不仅提升了故障识别的准确率与鲁棒性,更推动了工业智能运维中少样本、零样本诊断的实用化进程,对保障旋转机械安全运行具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作