管廊管线故障声纹(MFCC)数据集
收藏国家基础学科公共科学数据中心2026-02-07 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=697e270f195d2616afaf07a7&type=1
下载链接
链接失效反馈官方服务:
资源简介:
管廊管线故障声纹库数据在试点管廊(容西管廊豪丹段综合仓与讯电仓;容东管廊205段能源仓,水信仓与高压仓;容东管廊207段水信仓)采集与实验室管廊试验台中采集。在试点管廊中使用声纹传感器与录音主机采集管廊中的巡检脚步声纹与风机工作时的声纹;在北京交通大学唐山研究院载运工具运行安全实验室中通过实验平台采集管廊失效相关的声纹(管廊供电线路失效声纹;管廊供水管路泄漏声纹;管廊输气线路泄漏声纹;管廊供电线路失效与供水管路泄漏组合声纹;管廊供电线路失效与输气线路泄漏组合声纹;管廊供水管路泄漏与输气线路泄漏组合声纹)。通过模拟实际管廊的结构和尺寸比例,设计管廊数据采集实验平台,在管廊试验台中布置管线和采集设备,模拟不同工况下管线失效产生的声纹。
所有采集的声学数据均保存为WAV格式,以保证音频数据的高保真度,避免因压缩而造成的频谱信息丢失。采集过程中严格记录每一条数据的元信息,包括声源类型、泄漏位置、泄漏尺寸、管道压力、采集距离等。试验完成后,所有音频数据将被人工标注并存储到管廊声纹数据库中。在标注阶段,还将对音频进行时间切片处理,将每段音频分割为1秒时长的文件。同时对采集到的数据需要进行人工筛选,去掉不合格的音频和音频中空白的部分,保证音频的质量。
在完成WAV格式的音频数据集处理和建立后,需要将音频数据集进行预处理提取特征转换成MFCC梅尔谱图,然后对应保存成MFCC数据集。这个过程主要包括分帧,加窗,短时傅里叶变换和梅尔倒谱分析。
管廊管线故障音频MFCC数据集包含9个类别,分别是供水管道泄漏声纹,供气管道泄漏声纹,供电线路泄漏声纹、巡检脚步声纹、排风机声纹、供水管道泄漏与供气管道泄漏组合声纹、供水管道泄漏与供电线路泄漏组合声纹、供气管道泄漏与供电线路泄漏组合声纹、供水管道泄漏与供气管道泄漏与供电线路泄漏组合声纹,通过对WAV格式数据进行预处理提取特征转换后,然后按照每一帧进行切割得到,共940800条数据,1.66GB。
提供机构:
中国雄安集团基础建设有限公司
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集采集自试点管廊和实验室平台,模拟管廊管线故障声纹,数据以WAV格式保存并转换为MFCC特征,以保持音频高保真度。它包含9个类别,涵盖供水、供气、供电泄漏等故障声纹以及巡检脚步、风机等背景声纹,共计940800条数据,总大小为1.66GB。
以上内容由遇见数据集搜集并总结生成



