five

MIMII DUE

收藏
arXiv2021-09-27 更新2024-06-21 收录
下载链接:
https://zenodo.org/record/4740355
下载链接
链接失效反馈
资源简介:
MIMII DUE是由日立有限公司研究开发集团创建的一个用于工业机器故障调查和检查的声音数据集,特别关注由于操作和环境条件变化引起的领域转移问题。该数据集包含五种不同类型工业机器的正常和异常操作声音,分为源域和目标域,每个域包含不同的操作速度和环境噪声条件。整个数据集包含超过42000个10秒的单通道16位音频数据,采样率为16kHz。创建此数据集的目的是为了评估无监督异常声音检测的鲁棒性,特别是在领域转移条件下的表现。该数据集的应用领域包括机器状态监测和基于条件的维护,旨在解决在实际工厂环境中如何检测未知异常声音的问题。

MIMII DUE is an audio dataset developed by the Research and Development Group of Hitachi, Ltd., for industrial machine fault investigation and inspection, with a special focus on the domain shift issue arising from variations in operational and environmental conditions. The dataset includes normal and abnormal operating sounds of five distinct types of industrial machines, and is split into a source domain and a target domain. Each domain encompasses different operating speeds and environmental noise conditions. The entire dataset contains over 42,000 10-second single-channel 16-bit audio recordings with a sampling rate of 16 kHz. The objective of developing this dataset is to assess the robustness of unsupervised anomalous sound detection, especially its performance under domain shift conditions. Applications of this dataset cover machine condition monitoring and condition-based maintenance, with the goal of addressing the challenge of detecting unknown anomalous sounds in real-world factory environments.
提供机构:
日立有限公司研究开发集团
创建时间:
2021-05-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
MIMII DUE 数据集的构建旨在应对工业机器异常声音检测中的领域偏移问题。该数据集包含了五种不同类型工业机器的正常和异常运行声音,每种类型机器的数据又分为六个子集,每个子集对应于单一产品。数据集包含两个领域:源领域和目标领域,分别代表原始条件和变化后的条件。源领域拥有充足的训练数据,而目标领域则只有少量音频片段可用作训练数据。数据集中还包含了背景噪声数据,用于模拟真实环境。录音设置和后期处理过程也在数据集中进行了详细说明。
特点
MIMII DUE 数据集的主要特点在于其领域偏移的存在。源领域和目标领域在运行速度、机器负载、粘度、加热温度、环境噪声、信噪比等方面存在差异,使得数据集能够用于评估异常声音检测系统在领域偏移情况下的鲁棒性。此外,数据集还包含了背景噪声数据,用于模拟真实环境,使测试结果更具参考价值。
使用方法
MIMII DUE 数据集的使用方法主要分为以下几步:首先,选择合适的机器学习模型进行训练,例如自编码器或基于 MobileNetV2 的模型。其次,使用源领域的正常声音数据进行训练,并在目标领域的正常和异常声音数据上进行测试。最后,根据测试结果评估模型在领域偏移情况下的鲁棒性。数据集还提供了两种基线系统,可供研究人员参考和使用。
背景与挑战
背景概述
MIMII DUE 数据集是一项针对工业机器异常声音检测的宝贵资源,由 Hitachi, Ltd. 研究和开发团队创建于 2021 年。该数据集旨在解决实际应用中因操作和环境条件变化导致的域偏移问题,这是异常声音检测面临的一大挑战。MIMII DUE 数据集包含了五种不同类型工业机器在两种不同操作/环境条件下的正常和异常运行声音,其中包括源域和目标域,域偏移在两个域之间发生。实验结果表明,源域和目标域之间存在显著的性能差异,证明了数据集包含了域偏移。该数据集对于评估异常声音检测在域偏移情况下的鲁棒性具有重要意义。
当前挑战
MIMII DUE 数据集所面临的挑战主要在于如何处理域偏移问题。域偏移是指由于各种实际因素,训练阶段和操作阶段之间特征分布发生变化的现象。传统的异常声音检测方法在面对域偏移时,往往无法准确判断正常声音和异常声音,导致误报或漏报。此外,MIMII DUE 数据集还面临着构建过程中的挑战,例如如何模拟真实的工厂环境,如何选择合适的机器类型和异常条件,以及如何保证数据集的多样性和平衡性等。
常用场景
经典使用场景
MIMII DUE 数据集是一个用于检测工业机器故障声音的全新数据集,旨在应对实际应用中因操作和环境条件变化引起的域迁移问题。该数据集包含了五种不同类型工业机器在两种不同操作/环境条件(源域和目标域)下的正常和异常运行声音,并在两个域之间引入了域迁移。MIMII DUE 数据集的经典使用场景包括:1. 域迁移下的异常声音检测模型训练和评估;2. 无监督异常声音检测算法的研究和开发;3. 机器状态监测和预测性维护的应用。
实际应用
MIMII DUE 数据集在实际应用中具有广泛的应用前景,包括:1. 机器状态监测:通过实时监测机器运行声音,可以及时发现机器的异常状态,并进行预测性维护,从而提高生产效率和降低维护成本。2. 机器故障诊断:根据机器运行声音的特征,可以识别出不同的故障类型,并为故障诊断提供依据。3. 工业自动化:MIMII DUE 数据集可用于开发智能化的工业自动化系统,实现机器的自主运行和故障诊断。
衍生相关工作
MIMII DUE 数据集的发布推动了异常声音检测领域的研究和发展,衍生出了一系列相关的工作,包括:1. 无监督异常声音检测算法的研究和开发;2. 域迁移下的异常声音检测算法的研究和开发;3. 机器状态监测和预测性维护的应用研究。这些相关工作进一步推动了异常声音检测技术在工业领域的应用和发展。
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作