Small Short-sound Drill Dataset
收藏arXiv2021-11-09 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2108.11089v2
下载链接
链接失效反馈官方服务:
资源简介:
本研究使用的是小型短声钻数据集,由瑞典Valmet AB创建,用于监测钻机故障。数据集包含三类声音:异常声、正常声和无关声,总计约41,250条声音记录。数据集通过四台AudioBox iTwo Studio麦克风在96kHz采样率下录制。创建过程中,通过数据增强技术增加了数据集的样本量,以提高深度学习模型的性能。该数据集主要应用于工业机器故障检测,旨在通过声音分析提前识别钻机故障,减少机器停机时间和维护成本。
The small-scale short sound drilling dataset used in this study was created by Valmet AB of Sweden for drilling machine fault monitoring. This dataset contains three categories of sounds: abnormal sounds, normal sounds, and irrelevant sounds, with a total of approximately 41,250 audio recordings. It was recorded using four AudioBox iTwo Studio microphones at a sampling rate of 96 kHz. During its creation, data augmentation techniques were applied to expand the dataset's sample size so as to improve the performance of deep learning models. This dataset is primarily applied to industrial machine fault detection, aiming to identify drilling machine faults in advance through sound analysis, thereby reducing machine downtime and maintenance costs.
提供机构:
中瑞典大学电子设计系
创建时间:
2021-08-25
搜集汇总
数据集介绍

构建方式
在工业制造领域,设备状态监测对于保障生产连续性与降低维护成本至关重要。Small Short-sound Drill Dataset的构建源于对钻机故障声音检测的实际需求,该数据集采集自瑞典Valmet AB工厂的钻机运行现场,使用四台AudioBox iTwo Studio麦克风以96 kHz采样率录制。原始数据包含833个时长为20.83毫秒的声音文件和40,417个时长为41.67毫秒的声音文件,其中异常声音仅占总数的0.16%,呈现显著的不平衡性。为应对数据稀缺挑战,研究团队通过重采样技术创建了包含201个声音的平衡子集,并进一步采用时间偏移和音量控制两种数据增强方法,将样本量扩展至603个,有效提升了模型的泛化能力。
特点
该数据集的核心特点在于其聚焦于短时声音信号的分析,每个样本持续时间不足50毫秒,这为故障检测带来了独特的复杂性。数据集涵盖三类标签:异常声音、正常声音及无关声音,分别对应钻头破损、正常运行及环境噪声,这种多类别设计有助于模拟真实工业场景中的声音混杂情况。此外,数据集的规模相对较小,但通过精心设计的数据增强策略,成功克服了深度学习方法对大数据量的依赖,为小样本学习提供了实践范例。其声音波形兼具复杂性与短暂性,要求特征提取方法具备高时序分辨率与鲁棒性。
使用方法
在应用该数据集时,研究人员首先将增强后的声音信号转换为对数梅尔频谱图,以图像形式表征声音的时频特性。随后,采用卷积神经网络与长短期记忆网络结合的架构进行特征学习,其中CNN层负责从频谱图中提取局部特征,LSTM层则捕获时序依赖关系。为优化模型性能,激活函数选用Leaky ReLU以缓解梯度消失问题,并在LSTM后引入注意力机制,聚焦于钻头破损时刻的关键异常特征。训练过程中使用Adam优化器,以分类交叉熵为损失函数,通过早停策略防止过拟合。该方法在测试集上实现了92.35%的整体准确率,验证了其在工业故障诊断中的实用价值。
背景与挑战
背景概述
在工业制造领域,设备状态监测对于保障生产连续性与降低维护成本具有关键意义。Small Short-sound Drill Dataset由瑞典中部大学与越南Ton Duc Thang大学的研究团队于2021年共同构建,旨在通过声学信号实现钻机故障的早期检测。该数据集采集自Valmet AB工厂的实际钻机运行环境,包含异常、正常及无关声音三类样本,分别对应钻头破损、正常运行及环境噪声。其核心研究问题聚焦于如何在极短的音频片段(20.83毫秒至41.67毫秒)中有效识别钻头故障,为工业声学诊断提供了高时效性的数据基础,推动了基于深度学习的故障预测模型在资源受限场景下的应用探索。
当前挑战
该数据集面临的挑战主要体现在两方面:在领域问题层面,钻机故障检测需应对声波波形复杂且持续时间极短的特性,同时真实工业环境中并存多种背景噪声,导致特征提取与模式识别难度显著增加;在构建过程中,数据高度不平衡成为主要障碍,异常声音仅占总体样本的0.16%,难以支撑深度学习模型对少数类的有效学习。此外,原始数据规模有限,传统数据增强方法因音频片段过短而适用性受限,迫使研究者创新性地采用时移与音量调控等策略扩充样本,并设计融合泄漏线性整流单元与注意力机制的卷积-长短期记忆网络,以提升对小规模短时声学信号的分类鲁棒性。
常用场景
经典使用场景
在工业制造领域,设备状态监测是保障生产连续性与效率的核心环节。Small Short-sound Drill Dataset 的经典应用场景聚焦于钻机故障的声学检测,通过采集钻机运行时的短时声音信号,构建包含异常、正常及无关声音的三类数据集。该数据集特别适用于训练深度学习模型,如卷积神经网络与长短期记忆网络的结合体,以从复杂的声波波形中提取特征,实现对钻头断裂等故障的精准分类。其短时声音样本(约20.83毫秒至41.67毫秒)模拟了真实工业环境中声音信号的瞬态特性,为研究者在有限数据条件下探索故障检测算法提供了理想平台。
解决学术问题
该数据集主要解决了工业声学故障检测中的若干关键学术问题。针对小样本与数据不平衡的挑战,它通过时间偏移和音量控制等数据增强技术,有效扩充了少数类样本,缓解了深度学习模型在失衡数据集上的性能退化问题。同时,数据集中的短时声音信号促使研究者开发高效的特征提取方法,如利用对数梅尔频谱图转换声音为图像表示,结合注意力机制以聚焦关键时间帧,从而提升模型对细微故障特征的敏感性。这些创新不仅推动了基于声学的非侵入式故障诊断技术的发展,也为小样本学习在工业场景中的应用提供了理论支撑。
衍生相关工作
基于该数据集,衍生了一系列经典研究工作,推动了声学故障检测领域的算法创新。例如,研究者结合连续小波变换与梅尔频谱图,探索了传统机器学习分类器(如支持向量机与K近邻)在钻机故障诊断中的性能。进一步地,该数据集激发了深度学习模型的优化,如使用泄漏整流线性单元替代标准整流单元以缓解梯度消失问题,并引入帧级注意力机制增强长时序特征的表示能力。这些工作不仅验证了数据增强在小样本场景下的有效性,还为后续研究提供了基准,促进了卷积神经网络与循环神经网络在工业声学分析中的融合应用。
以上内容由遇见数据集搜集并总结生成



