five

Fiber_Optical_Microphone_Dataset_with_DAS

收藏
github2025-11-10 更新2025-11-11 收录
下载链接:
https://github.com/zhangSmallSky/Fiber_Optical_Microphone_Dataset_with_DAS
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含八种类型的事件:风扇异常、风扇正常、泵异常、泵正常、滑块异常、滑块正常、阀门异常和阀门正常。每个音频片段持续10秒。声学信号通过光纤麦克风捕获,并使用短时傅里叶变换(STFT)处理生成时频谱图。每种事件包含80个训练样本和20个测试样本。

This dataset encompasses eight types of events: fan anomaly, normal fan operation, pump anomaly, normal pump operation, slider anomaly, normal slider operation, valve anomaly, and normal valve operation. Each audio clip has a duration of 10 seconds. Acoustic signals are captured by optical fiber microphones and processed using Short-Time Fourier Transform (STFT) to generate time-frequency spectrograms. Each event category includes 80 training samples and 20 test samples.
创建时间:
2025-11-10
原始信息汇总

数据集概述

基本描述

  • 数据集名称:Fiber_Optical_Microphone_Dataset_with_DAS
  • 用途:非商业科学研究
  • 数据采集设备:光纤麦克风
  • 原始数据来源:机械故障数据集原始音频来自https://arxiv.org/abs/1909.09347

数据类型

  • HCC:采用提出的光纤麦克风测量的数据
  • HC:采用常规光纤麦克风测量的数据

事件类别

包含8种事件类型:

  • fan_abnormal(风扇异常)
  • fan_normal(风扇正常)
  • pump_abnormal(泵异常)
  • pump_normal(泵正常)
  • slider_abnormal(滑块异常)
  • slider_normal(滑块正常)
  • valve_abnormal(阀门异常)
  • valve_normal(阀门正常)

数据规格

  • 音频时长:每个音频片段持续10秒
  • 训练样本:每个事件类型80个样本
  • 测试样本:每个事件类型20个样本

数据处理

  • 处理方法:短时傅里叶变换(STFT)
  • 输出形式:时频谱图
  • 时频谱图特征:
    • 横轴:时间(0-10秒)
    • 纵轴:频率(0-6 kHz)
    • 颜色强度:对应声信号的幅度

数据存储

  • 存储平台:Google Drive和百度网盘
  • 获取方式:通过Data.txt文件中提供的链接访问
搜集汇总
数据集介绍
main_image_url
构建方式
在光纤声学传感研究领域,该数据集通过创新性地部署两种光纤麦克风系统进行构建。HCC代表采用新型光纤麦克风采集的数据,HC则对应传统光纤麦克风记录的数据。原始声学信号源自机械故障诊断领域的公开数据集,涵盖风扇、泵体、滑块和阀门四类设备的正常与异常状态各八种事件类型。所有音频样本均统一处理为10秒时长,并通过短时傅里叶变换将时域信号转换为时频谱图,其中横轴标记0-10秒时间序列,纵轴表征0-6kHz频率范围,色彩强度映射声波振幅特征。
特点
该数据集在分布式声学传感技术框架下展现出独特优势。其核心特征在于同步提供传统与新型光纤麦克风的并行数据采集,为传感器性能对比研究奠定基础。数据集精心设计了机械设备的健康状态监测场景,每种事件类型包含80个训练样本与20个测试样本的标准化划分,确保模型验证的可靠性。时频谱图数据以三维矩阵形式呈现时间-频率-能量关系,为深度学习模型提供丰富的特征学习空间。特别值得注意的是,异常状态与正常状态的成对设计,极大便利了故障检测算法的开发与验证。
使用方法
针对光纤声学模式识别任务,研究者可通过云端存储平台获取完整数据集。数据使用需遵循非商业科研用途规范,并按规定引用原始文献。在具体应用中,建议将时频谱图作为输入特征,利用卷积神经网络处理其图像化表征。训练阶段可采用八分类框架区分不同设备状态,或构建二分类模型专注异常检测。测试集的独立设置为模型泛化能力评估提供标准依据,而6kHz的频率覆盖范围确保了对机械故障特征频段的完整捕获。为保障研究可复现性,建议严格遵循原始数据划分方案进行模型训练与验证。
背景与挑战
背景概述
光纤麦克风数据集结合分布式声学传感技术,由研究团队于2023年构建,旨在推动工业设备状态监测领域的发展。该数据集聚焦机械故障诊断这一核心问题,通过采集风扇、泵、滑阀等八类设备的正常与异常声学信号,为智能检测算法提供关键数据支撑。其创新性地融合新型光纤麦克风与传统传感技术,显著提升了声学特征提取的精度,对工业物联网的可靠性研究产生了深远影响。
当前挑战
在机械故障诊断领域,传统方法难以有效区分复杂工况下的细微声学特征差异,而本数据集通过高分辨率时间频谱图构建了多维特征空间。数据构建过程中,面临声学信号在强噪声环境下的采集稳定性挑战,需解决光纤传感器与机械振动源之间的耦合干扰问题。同时,原始数据需经过短时傅里叶变换的精确转换,确保时频表征的完整性成为关键技术难点。
常用场景
经典使用场景
在光纤声学传感研究领域,该数据集为机械故障诊断提供了标准化的实验基准。研究人员通过分析八类机械设备的正常与异常状态声学信号,能够系统评估不同光纤麦克风技术的检测性能。数据集包含风扇、泵体、滑阀等工业常见设备的运行状态数据,为声学故障诊断算法开发提供了丰富的训练样本和测试基准。
实际应用
在工业实践层面,该数据集支撑了智能运维系统的开发应用。基于数据训练的故障诊断模型可部署于工厂设备监测场景,实时识别机械异常状态。特别是在石油化工、电力设备等关键领域,光纤声学传感技术能够实现远距离、多点的连续监测,为预防性维护提供技术保障,显著提升工业设备运行可靠性。
衍生相关工作
该数据集催生了系列基于深度学习的机械故障诊断研究。研究者利用卷积神经网络对时频谱图进行特征提取,开发了高效的异常检测算法。相关成果延伸至工业物联网声学监测系统设计,推动了光纤传感与人工智能的交叉融合。基于该数据集的基准测试已成为评估新型故障诊断方法的重要参照标准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作