five

GPLA-12|气体管道泄漏检测数据集|声学信号分析数据集

收藏
arXiv2021-06-19 更新2024-07-25 收录
气体管道泄漏检测
声学信号分析
下载链接:
https://github.com/Deep-AI-Application-DAIP
下载链接
链接失效反馈
资源简介:
GPLA-12是由重庆科技学院智能技术与工程学院创建的一个针对气体管道泄漏的声学信号数据集,包含684条训练/测试声学信号,分为12个类别。该数据集通过在完整的气体管道系统上人工制造泄漏来收集声学信号,并经过结构化处理形成。GPLA-12旨在作为时间序列任务和分类的特征学习数据集,适用于解决工业过程中的故障检测和诊断问题。
提供机构:
重庆科技学院智能技术与工程学院
创建时间:
2021-06-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
GPLA-12数据集的构建基于一个完好的气体管道系统,通过外部人工泄漏模拟,收集了684个训练/测试的声学信号样本。该数据集的构建采用了结构化的裁剪方法,将收集的数据转化为时间序列变量,每个样本持续5秒钟,具有1460个长度。数据集包含12个类别的声学气体泄漏信号,涵盖了不同的压力条件、噪声环境以及两种不同参数的麦克风,从而保证了数据的多样性和减少了设备偏差。
特点
GPLA-12数据集的特点在于其涵盖了多种不同条件下的声学信号,包括不同的气体压力(0.2 MPa、0.4 MPa、0.5 MPa)、噪声环境(无噪声和强噪声)以及两种不同参数的麦克风收集的数据。这种多样性使得数据集适用于各种算法的二元和多元分类问题,同时也适合于时间序列任务和特征学习。
使用方法
使用GPLA-12数据集时,用户可以从www.daip.club和github.com/Deep-AIApplication-DAIP网站获取数据集及其预训练模型。数据集分为训练集和测试集,用户可以采用10折交叉验证来训练和测试各种分类器,如支持向量机(SVM)、随机森林(RF)、深度神经网络(如CNN和DBN)等。此外,数据集还支持浅层分类器的训练,如Scikit-toolbox中的各种算法。
背景与挑战
背景概述
GPLA-12数据集是一款专注于气体管道泄漏声学信号的数据库,由重庆科技大学的智能技术与工程学院的Jie Li和电气工程学院的Lizhong Yao等人创建。该数据集汇集了684个训练/测试声学信号样本,分为12个类别,涵盖了不同压力条件下的气体泄漏声学信号。GPLA-12的构建旨在促进故障诊断领域的研究,特别是为时序任务和分类提供特征学习数据集。该数据集及其预训练模型已在www.daip.club和github.com/Deep-AIApplication-DAIP网站上发布,为公开研究提供了支持。
当前挑战
GPLA-12数据集在构建过程中遇到的挑战主要包括:1)收集具有代表性的气体泄漏声学信号,确保数据的质量和多样性;2)设计有效的数据预处理方法,以减少数据中的噪声和偏差;3)选择合适的分类算法来处理声学信号数据,并优化模型性能。此外,该数据集在解决领域问题方面的挑战包括:提高声学信号分类的准确性,尤其是在噪声环境下的识别能力;以及开发适用于时序任务的分类和预测算法。
常用场景
经典使用场景
GPLA-12数据集在故障诊断领域中被广泛应用于时间序列任务和分类问题。其经典使用场景包括利用该数据集中的声学信号进行泄漏检测,通过机器学习模型提取特征并分类,以识别管道系统中是否存在泄漏以及泄漏的具体类型。
解决学术问题
GPLA-12数据集解决了故障诊断研究中公开数据集稀缺的问题,为学术界提供了一个包含12种类别的684个声学信号的标准化数据集。它有助于研究者开发和应用深度学习模型进行声学信号的分类,提高了故障检测的准确性和效率。
衍生相关工作
基于GPLA-12数据集,研究者们已经开展了一系列相关工作,包括但不限于使用卷积神经网络和循环神经网络对声学信号进行特征学习和分类,以及将此数据集应用于实际的故障诊断系统中,进一步推动了故障检测与诊断技术的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

WideIRSTD Dataset

WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。

github 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录