CEPREI-6909 Dataset
收藏github2026-04-04 更新2026-05-03 收录
下载链接:
https://github.com/Sephiroth66616/CEPREI-6909-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
CEPREI-6909工业数据集是从中国电子产品可靠性与环境测试研究所(CEPREI)的定制机械故障模拟平台收集的,专门设计用于评估在极端复合工作条件变化和自然类别不平衡场景下基于人工智能的故障诊断方法。数据集包含1种健康状态和6种复杂故障状态,包括线切割损伤和结构笼断裂。数据采集遵循全因子实验设计,涵盖极端速度和重负载。
The CEPREI-6909 Industrial Dataset is collected from the customized mechanical fault simulation platform of the China Electronics Reliability and Environmental Testing Institute (CEPREI). It is specifically designed to evaluate AI-based fault diagnosis methods under extreme varying compound operating conditions and natural class imbalance scenarios. The dataset includes 1 healthy state and 6 complex fault states, covering wire-cut damage and structural cage fracture. Data acquisition follows a full-factorial experimental design, which covers extreme speeds and heavy loads.
创建时间:
2026-04-04
原始信息汇总
数据集概述:CEPREI-6909 跨域故障诊断数据集
1. 基本信息
- 数据集名称:CEPREI-6909
- 来源机构:中国电子产品可靠性与环境试验研究所(CEPREI)
- 用途:用于评估基于人工智能的故障诊断方法在极端复合工况变化和自然类不平衡场景下的性能
- 论文主题:Causal Prototype Variational Information Bottleneck Framework for Cross-Domain Fault Diagnosis(目前处于同行评审阶段)
- 公开状态:论文接收后,数据集将完全公开免费开放
2. 实验平台配置
- 组成部件:变频驱动电机与联轴器、Type-6909 深沟球轴承、非线性液压加载系统(用于模拟真实工业传动链动态特性)
3. 数据采集规格
- 采样率:10 kHz
- 每样本时长:0.768 秒
- 传感器类型:加速度计
4. 故障模式与物理参数
数据集包含 1 种健康状态 和 6 种复杂故障状态,具体如下:
| 标签 | 故障类型 | 位置 | 尺寸/严重程度 |
|---|---|---|---|
| 0 | 正常 | - | - |
| 1 | 沟槽 | 内圈 | 0.4 mm |
| 2 | 沟槽 | 内圈 | 0.6 mm(严重) |
| 3 | 沟槽 | 外圈 | 0.4 mm |
| 4 | 沟槽 | 外圈 | 0.6 mm(严重) |
| 5 | 点蚀 | 滚动体 | 0.4 mm |
| 6 | 断裂 | 保持架 | 结构性断裂 |
5. 可变运行工况
采用全因子实验设计,覆盖极端转速与重载荷,构建严重域偏移场景:
| 数据集标签 | 径向载荷设定 (N) | 转速设定 (rpm) | 总工况数 |
|---|---|---|---|
| 0, 1, 2, 3, 4, 5 | 320, 420, 820, 1220, 1620, 2020 | 300, 600, 900, 1200, 1500, 1800, 2100, 2400, 2700, 3000 | 60 |
| 6(保持架断裂) | 320 | 300, 600, 900, 1200, 1500, 1800, 2100, 2400, 2700, 3000 | 10 |
- 注:标签6(保持架断裂)因重载下存在安全风险,仅限320 N基础载荷,这为评估模型在类不平衡和缺失目标标签下的鲁棒性提供了天然测试平台。
6. 推荐跨域评估任务
- 单变量偏移:跨转速(如300-1500 rpm ↔ 1800-3000 rpm)、跨载荷(轻载 ↔ 重载)
- 复合偏移:转速与载荷同时剧烈变化(如低速轻载 → 高速重载)
- 部分域自适应:评估目标域结构缺失特定故障模式(如重载下无标签6)时的模型稳定性
搜集汇总
数据集介绍

构建方式
CEPREI-6909数据集源自中国电子产品可靠性与环境试验研究所(CEPREI)定制化机械故障模拟平台,旨在为跨域故障诊断研究提供严苛的测试环境。数据集通过集成变频驱动电机、联轴器、Type-6909深沟球轴承及非线性液压加载系统,模拟真实工业传动链的动态特性。采用加速度计以10 kHz采样率采集振动信号,每个样本时长为0.768秒。实验设计覆盖1种健康状态与6种复杂故障模式(包括滚道线切割损伤和保持架结构断裂),并在极端转速(300-3000 rpm)与重载(320-2020 N)组合下按全因子设计获取共计70种工况数据。其中,保持架断裂因安全限制仅在320 N轻载下采集,自然引入了严重的类别不平衡与目标标签缺失场景,为评估诊断模型在极端复合工况迁移下的鲁棒性提供了理想的数据基础。
使用方法
研究者可基于CEPREI-6909数据集构建多种跨域诊断评估任务。推荐采用单变量迁移(如跨转速或跨负载)、复合迁移(同时改变转速与负载)以及部分域自适应迁移(目标域缺失特定故障类别)三类典型设置,以全面检验模型的迁移泛化能力。数据使用前需按照工况标签将原始振动信号组织为源域与目标域样本集,建议将时域信号直接输入或经过短时傅里叶变换提取时频特征后用于模型训练与测试。论文接收后,完整数据集将通过本仓库开放下载,并附详细的数据加载脚本与示例代码,方便研究者快速复现基准实验并开展新方法对比。
背景与挑战
背景概述
旋转机械作为工业传动系统的核心部件,其健康状态监测在智能制造中占据关键地位。然而,实际工况常呈现非平稳特性,如转速与负载的剧烈波动,导致监测数据存在显著域偏移与伪相关现象,对传统故障诊断方法构成严峻挑战。为破解这一难题,中国电子产品可靠性与环境试验研究所(CEPREI)于近期构建了CEPREI-6909数据集。该数据集依托定制化机械故障模拟平台,涵盖1种健康状态与6种复杂故障模式,包括滚道线切割损伤及保持架结构断裂等典型失效类型。研究团队采用全因子实验设计,在6种径向负载与10种转速组合下采集振动信号,总计生成6909个样本,旨在为跨域故障诊断方法提供极端工况变化与天然类别不平衡场景下的验证基准。该数据集的提出,有望推动因果推断与信息瓶颈理论在工业诊断领域的深度融合,对提升模型泛化性与鲁棒性具有重要学术价值。
当前挑战
CEPREI-6909数据集所应对的核心挑战在于工业场景下跨域故障诊断的范式困境:传统监督学习方法在面对非平稳工况引发的域偏移时,模型性能急剧退化,难以捕捉故障的因果不变特征。具体而言,数据集通过极端工况组合构造了三大转移任务。其一为单变量域偏移,即在转速或负载单一维度剧烈变化时,振动信号的分布差异导致特征混淆。其二为复合域偏移,要求诊断模型同时适应转速与负载的同步突变,这对特征解耦能力提出更高要求。其三,保持架断裂故障因安全限制仅能在低负载下采集,天然形成目标域结构缺失与类别极度不平衡格局。构建过程中,确保极端工况下数据采集的物理安全性,以及平衡多变量交互条件下样本的代表性与完备性,均为实验设计的显著挑战。这些难题共同构筑了评估跨域诊断方法鲁棒性与泛化能力的严苛测试床。
常用场景
经典使用场景
在跨域故障诊断这一前沿研究领域中,CEPREI-6909数据集凭借其对极端复合工况迁移与天然类别不平衡场景的精准模拟,成为评估与验证智能诊断模型鲁棒性的标杆性基准。该数据集采集自包含变频驱动电机、6909型深沟球轴承及非线性液压加载系统的定制化机械故障模拟平台,通过全因子实验设计,在10 kHz采样率下获取了0.768秒每样本的振动信号,涵盖了从正常状态到内圈沟槽、外圈沟槽、滚动体点蚀及保持架断裂等7种健康与故障模式。研究者可基于此构建单变量偏移(如交叉转速或交叉载荷)、复合工况偏移(如低速轻载至高速重载)以及部分域适应(目标域缺失特定故障标签)等典型跨域任务,从而深入探索故障诊断模型在域漂移与虚假相关干扰下的泛化能力。
解决学术问题
该数据集直面旋转机械在实际工业非平稳工况中因转速和载荷剧烈变化引发的域漂移与虚假相关难题,为学术界提供了一个可复现的极端条件测试平台。通过内置的天然类别不平衡——保持架断裂标签因物理安全限制仅在基础载荷下采集——以及复合工况偏移设计,CEPREI-6909精准解决了现有公共数据集缺乏真实物理约束与极端域差异的痛点,推动了因果推断、信息瓶颈及域适应等理论在故障诊断领域的实证研究。其发布不仅填补了高挑战性跨域基准的空白,更促使学界重新审视模型在缺失目标标签与稀疏类别下的稳定性,为构建更可靠、更鲁棒的智能诊断方法奠定了坚实的实验基础。
实际应用
在实际工业场景中,CEPREI-6909数据集为旋转机械的预测性维护与健康管理提供了关键验证工具,尤其适用于风力发电机组、航空发动机及重型机床等常面临变速变载工况的核心设备。基于该数据集训练的诊断模型,可直接迁移至工厂环境下因负载波动或转速骤变而难以覆盖全部故障模式的监测系统,有效降低因数据分布偏移导致的误报与漏报风险。此外,该数据集对保持架断裂等罕见但破坏性故障的模拟,支撑了高风险部件的实时异常预警与安全防护策略开发,助力企业减少非计划停机时间并优化维修决策,具有显著的经济效益与安全保障价值。
数据集最近研究
最新研究方向
在工业旋转机械的智能故障诊断领域,数据分布的域偏移与伪相关性问题始终是制约模型泛化性能的核心瓶颈。CEPREI-6909数据集由赛宝实验室基于定制化机械故障模拟平台构建,精准捕捉了变转速、变载荷等极端复合工况下的真实域偏移特征,并涵盖了从轻微点蚀到保持架断裂的七类典型故障模式。该数据集的前沿研究聚焦于利用因果变分信息瓶颈框架解耦域不变特征,以应对自然类别不平衡与缺失目标标签的跨域迁移挑战。通过设计如高低速/轻重载的单变量偏移、复合工况骤变以及部分域适应等严苛评估任务,研究者得以系统验证模型在动态工业链条中的鲁棒性与可解释性。该数据集的发布为突破非平稳工况下故障诊断的算法瓶颈提供了关键基准,有望推动工业AI从实验室理想环境向真实产线应用转化。
以上内容由遇见数据集搜集并总结生成



