RMIS Benchmark

github2026-02-13 更新2026-02-14 收录

下载链接：

https://github.com/jianganbai/RMIS

下载链接

链接失效反馈

官方服务：

资源简介：

RMIS是一个全面的基准，用于评估多模态工业信号的表示模型。它包含6个异常检测数据集和13个故障诊断数据集，涵盖4种不同的模态（声音、振动、电压、电流），总时长达到1.2k小时。RMIS旨在为社区提供一个公平、可信且即用的基准，以便轻松评估信号模型。

RMIS is a comprehensive benchmark for evaluating representation models of multimodal industrial signals. It includes 6 anomaly detection datasets and 13 fault diagnosis datasets, covering 4 distinct modalities: sound, vibration, voltage, and current, with a total duration of 1.2 thousand hours. RMIS aims to provide the research community with a fair, credible and ready-to-use benchmark to facilitate straightforward evaluation of signal models.

创建时间：

2026-02-13

原始信息汇总

RMIS 数据集概述

数据集基本信息

数据集名称：RMIS Benchmark (Representation of M5 Industrial Signals)
发布状态：已发布 (2026年2月13日)
许可证：MIT License (注：数据集内各来源数据可能拥有其自身的许可证)
相关论文：FISHER: A Foundation Model for Multi-Modal Industrial Signal Comprehensive Representation (arXiv:2507.16696)

数据集目的与范围

RMIS 是一个用于评估多模态序列类工业信号基础模型的综合性基准。它旨在为社区提供一个公平、可信且开箱即用的基准，以便轻松评估信号模型。

数据集构成与规模

RMIS 基准整合了来自13个公开数据源的数据，总数据量达 1.2k 小时，涵盖 4 种不同的模态（声音、振动、电压、电流）。

异常检测数据集

包含 6 个 数据集，均来自DCASE挑战赛，模态为声音。

数据集	模态	采样率	数据量	机器数量
DCASE 2020	声音	16 kHz	153 h	6
DCASE 2021	声音	16 kHz	165 h	7
DCASE 2022	声音	16 kHz	139 h	7
DCASE 2023	声音	16 kHz	50 h	14
DCASE 2024	声音	16 kHz	49 h	16
DCASE 2025	声音	16 kHz	45 h	15

故障诊断数据集

包含 7 个 数据集（共13个任务），涵盖多种模态和故障类型。

数据集	模态	采样率	数据量	任务
IICA	声音	48 kHz	47 h	泄漏检测
IIEE	声音	44.1 kHz	1 h	发动机故障
WTPG	振动	48 kHz	14 h	齿轮箱故障
MaFaulDa	声音/振动	50 kHz	19 h	轴承故障
SDUST	振动	25.6 kHz	42 h	轴承/齿轮故障
UMGED	声音/振动/电压/电流	51.2 kHz	469 h	齿轮偏心
PU	振动/电流	64 kHz	9 h	轴承故障

任务定义与评估方法

异常检测：预测信号是否异常，无需任何先验异常样本。评估遵循 DCASE 挑战赛规则。
故障诊断：在提供参考标签数据的情况下，识别信号的具体故障类型。对于没有官方划分的数据集，采用密封的训练-测试划分（来自同一记录同一通道的片段不能同时出现在训练集和测试集中），以防止因信号平稳性导致过于乐观的结果。
评估协议：所有模型均通过 KNN 推理进行评估，无需任何微调。

数据获取与预处理

数据来源：RMIS 基准数据来源于13个公开数据集，包括DCASE系列、IICA、IIEE、WTPG、MaFaulDa、SDUST、UMGED和PU。
便捷下载：为方便用户，所有预处理后的基准数据托管在清华大学云盘 (https://cloud.tsinghua.edu.cn/d/eb1f8c37f3264812a53c/)，密码为 RMIS_dataset。
原始下载：也提供了从各数据源下载的指南 (utils/download/README.md) 和预处理说明 (utils/preprocess/README.md)。

代码库与模型集成

代码库设计：旨在将模型表示与下游评估解耦，核心瓶颈仅为一个嵌入字典 {file: embed}，便于快速适配新模型和新数据集。
已集成模型：当前集成了6个模型用于评估：AudioMAE、BEATs、EAT、CED、DaSheng 和 FISHER。
自定义模型测试：支持用户通过实现模型包装器和定义推理配置，轻松将自己的模型集成到RMIS基准中进行测试。

使用流程概要

环境准备：克隆代码库并安装依赖。
数据准备：下载数据并解压至指定结构，或从各原始源下载并预处理。
路径配置：在 conf/basic.yaml 中填写数据集和模型检查点的路径。
元数据生成：为所有数据集生成元数据。
运行评估：使用单一命令测试已集成模型或用户自定义模型。

基准结果

结果查看：完整的模型性能结果请访问 RMIS 排行榜 (https://jianganbai.github.io/RMIS/leaderboard.html)。
图示摘要：代码库文档中提供了模型在RMIS基准上得分的摘要图示 (docs/assets/score.png)。

搜集汇总

数据集介绍

构建方式

在工业信号处理领域，构建一个全面且标准化的评估基准对于推动基础模型的发展至关重要。RMIS Benchmark通过整合13个公开可用的工业信号数据集，精心构建了一个涵盖异常检测与故障诊断两大核心任务的综合性基准。该基准汇集了来自DCASE系列挑战赛以及多个权威工业数据集的数据，覆盖声音、振动、电压和电流四种模态，总时长达到1.2千小时。构建过程中，团队对原始数据进行了统一的预处理，将其转换为标准化的10秒音频片段，并采用了严格的密封式训练-测试分割策略，确保来自同一记录通道的片段不会同时出现在训练集和测试集中，从而有效避免了因信号平稳性导致的评估结果过于乐观的问题。

特点

RMIS Benchmark的显著特点在于其前所未有的规模与模态多样性，为多模态序列式工业信号的基础模型评估设立了新的标准。该基准不仅数据体量庞大，更涵盖了从异常检测到具体故障类型识别的完整任务谱系，其中异常检测任务遵循DCASE挑战的无监督规则，而故障诊断任务则提供了带标签的数据作为参考。其设计理念强调模型表征与下游评估的解耦，核心仅为一个嵌入字典，这种架构使得新模型与新数据集的集成变得异常高效。此外，基准提供了预处理的完整数据包与详尽的代码库，支持包括AudioMAE、BEATs及FISHER在内的多种先进模型的一键式评估，极大地降低了研究者的使用门槛。

使用方法

为了便捷地利用RMIS Benchmark进行评估，研究者首先需要克隆代码仓库并安装依赖，随后从指定的云存储下载已预处理的数据集。使用前，需在配置文件中指定数据集与模型检查点的路径，并运行命令生成所有数据集的元数据。评估集成模型时，仅需执行单一命令即可计算模型在所有数据集上的综合得分。对于希望测试自有模型的研究者，流程同样简洁：只需在指定目录下实现模型封装类并定义相应的推理配置文件，便可利用相同的命令接口将新模型纳入基准测试框架。该代码库支持以原始波形、短时傅里叶变换或滤波器组等多种特征作为输入，确保了与不同模型实现的广泛兼容性。

背景与挑战

背景概述

在工业智能与预测性维护领域，多模态时序信号的表征学习正成为关键研究方向。RMIS基准数据集于2026年2月由研究团队正式发布，旨在系统评估基础模型在工业信号多模态表征上的性能。该数据集整合了来自13个公开数据源的异常检测与故障诊断任务，涵盖声音、振动、电压及电流四种模态，总时长达到1.2千小时，为工业信号处理领域提供了首个大规模、标准化的评估框架。其核心研究问题聚焦于如何构建能够统一处理多模态工业信号的基础模型，以推动智能运维与工业物联网的技术进步。

当前挑战

RMIS基准所应对的领域挑战在于工业信号的多模态异质性与标注稀缺性。工业设备产生的信号往往具有高噪声、非平稳及模态间分布差异大的特性，使得单一模型难以实现跨模态的有效表征。同时，异常检测任务常面临无监督或小样本场景，而故障诊断则需在有限标注下实现细粒度分类。在数据集构建过程中，挑战主要体现为多源数据的标准化整合与预处理。不同原始数据集在采样率、信号长度及标注格式上存在显著差异，需设计统一的密封训练-测试分割策略以避免因信号平稳性导致的过拟合，并确保评估的公平性与可复现性。

常用场景

经典使用场景

在工业信号处理领域，RMIS基准测试集为多模态序列信号的基础模型评估提供了标准化平台。其经典使用场景集中于模型表征能力的横向对比，研究者通过该基准集成的统一评估流程，能够便捷地测试各类信号处理模型在异常检测与故障诊断任务上的泛化性能。该场景通常涉及将模型嵌入向量提取后，采用KNN推理进行无微调评估，从而在涵盖声音、振动、电压和电流等多种模态的1.2千小时数据上，客观衡量模型对工业信号的本质特征捕捉能力。

实际应用

在实际工业运维场景中，RMIS基准所涵盖的多模态信号数据直接对应于设备状态监控与预测性维护需求。例如，在旋转机械故障预警系统中，模型可利用该数据集训练的振动与声音表征，实时识别轴承磨损或齿轮偏心等早期故障特征。电力系统中，电压与电流信号的异常模式检测有助于预防电网设备失效。这些应用通过将基准验证的高效表征模型部署至边缘计算设备，实现了工业设备健康状态的智能化、非侵入式监测，显著提升了运维效率与安全性。

衍生相关工作

围绕RMIS基准，已衍生出多项聚焦于工业信号表征学习的经典研究工作。其中，FISHER模型作为该基准的配套基础模型，专门针对多模态工业信号设计了层次化融合架构，在基准评估中展现了优越性能。同时，集成于基准的AudioMAE、BEATs等通用音频模型通过适配工业信号特性，拓展了其应用边界。这些工作共同推动了如自监督预训练、跨模态对齐等表征学习技术在工业领域的创新，并催生了面向特定工业场景的轻量化模型变体，形成了从基准评估到模型优化的完整研究生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集