five

SIA-IDE/MBHM

收藏
Hugging Face2025-04-12 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/SIA-IDE/MBHM
下载链接
链接失效反馈
官方服务:
资源简介:
MBHM数据集是第一个用于轴承健康管理研究的多模态数据集,分为振动信号和健康管理语料库两部分。振动信号和状态信息来源于9个公开数据集,并通过离散余弦归一化(DCN)将不同数据集的振动信号转换为相同长度(24000)。该数据集包含数千种工况,为识别模型提供了更具挑战性的任务,并更好地代表了实际使用场景。

The MBHM dataset is the first multimodal dataset designed for the study of bearing health management. It is divided into two parts: vibration signals and health management corpus. The vibration signals and condition information are derived from 9 publicly available datasets. The thousands of working conditions pose more difficult challenges for the identification model and better represent real-world usage scenarios. The vibration signals from different datasets have been converted to the same length (24000) by Discrete Cosine Normalization (DCN).
提供机构:
SIA-IDE
搜集汇总
数据集介绍
main_image_url
构建方式
在轴承健康管理这一工业智能核心领域,数据集的构建需兼顾信号的真实性与标注的严谨性。MBHM数据集作为该领域的首个多模态资源,其构建过程系统整合了九个公开数据源的振动信号与工况信息。通过离散余弦归一化技术,原始长度不一的振动信号被统一标准化为24000个采样点,确保了数据维度的一致性,为模型训练提供了规整的输入。这种构建方式不仅汇集了数千种复杂工况下的监测数据,更通过信号处理技术弥合了不同来源数据的异质性,为研究真实工业场景下的轴承状态识别奠定了坚实基础。
特点
该数据集的核心特征在于其开创性的多模态架构与对现实复杂性的高度还原。数据集精心融合了振动信号与健康管理文本语料,形成了信号-知识双驱动的数据生态。其收录的振动信号源自多样化的公开数据集,涵盖了广泛的轴承类型、负载条件与故障模式,从而构建了一个包含数千种独特工况的挑战性评估环境。这种高复杂性与多样性特征,使得数据集能够更逼真地模拟工业现场中轴承健康状态监测所面临的不确定性,为开发鲁棒性更强的智能诊断模型提供了至关重要的测试基准。
使用方法
对于致力于轴承故障预测与健康管理的研究者而言,该数据集提供了标准化的接入途径。用户可通过Hugging Face平台直接下载数据文件,并参考提供的演示脚本加载数据集以探查数据结构。数据集适用于词分类与问答等多种自然语言处理任务,同时也支持对标准化振动信号进行深度特征学习与模式识别。在实际应用中,研究者可依据论文与代码仓库中详述的离散余弦归一化原理,对数据进行预处理或扩展,进而将其集成至各类机器学习框架中,用于训练和验证面向工业设备智能运维的先进算法模型。
背景与挑战
背景概述
在工业设备预测与健康管理领域,轴承作为旋转机械的核心部件,其运行状态的精准监测对保障生产安全与效率至关重要。由SIA-IDE研究团队于2025年构建的MBHM数据集,是首个面向轴承健康管理的多模态数据集,旨在解决传统单模态方法在复杂工况下表征能力不足的核心研究问题。该数据集整合了来自九个公开数据源的振动信号与健康管理文本语料,通过统一的信号处理框架,为基于人工智能的故障诊断与寿命预测模型提供了高质量的基准数据,显著推动了PHM领域向多模态融合与知识增强方向的演进。
当前挑战
MBHM数据集致力于应对工业场景中轴承健康状态识别与管理的核心挑战,其首要难题在于如何从高噪声、非平稳的振动信号中提取鲁棒且可泛化的特征,以应对数千种真实工况的复杂变化。在构建过程中,研究团队面临多源异构数据融合的艰巨任务,需将不同采样率、长度与格式的原始信号通过离散余弦归一化技术进行标准化对齐,同时确保文本语料与物理信号在语义层面的有效关联,这一过程对数据清洗、标注一致性及跨模态表示学习提出了极高要求。
常用场景
经典使用场景
在工业设备状态监测领域,MBHM数据集为轴承健康管理研究提供了首个多模态基准。其经典使用场景集中于融合振动信号与文本语料,构建端到端的故障诊断与预测模型。研究人员利用该数据集训练深度学习模型,从标准化处理的振动时序数据中提取特征,并结合健康管理文本描述,实现轴承退化状态的精准识别与剩余使用寿命预测。这种多模态融合方法显著提升了模型在复杂工况下的泛化能力与解释性。
解决学术问题
该数据集有效解决了轴承健康管理中数据模态单一、工况覆盖有限的学术瓶颈。通过整合九个公开数据源的振动信号并辅以文本语料,它构建了统一的跨模态表示空间,使得模型能够学习振动物理模式与语义描述之间的关联。这为研究多模态表征学习、小样本故障诊断以及领域自适应方法提供了关键实验基础,推动了故障预测与健康管理(PHM)领域从单一信号分析向知识增强的智能决策范式转变。
衍生相关工作
围绕MBHM数据集,已衍生出多项经典研究工作,其中最具代表性的是其配套框架BearLLM。该框架利用数据集构建了先验知识增强的轴承健康管理模型,实现了振动信号的统一表征学习。后续研究在此基础上拓展了多任务学习、跨域迁移以及视觉-语言预训练在工业PHM中的应用。这些工作共同推动了基于大语言模型的设备健康管理新范式,为工业人工智能领域提供了重要的方法论与工具链参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作