GasVid
收藏arXiv2025-05-01 更新2025-05-13 收录
下载链接:
http://arxiv.org/abs/2505.00295v1
下载链接
链接失效反馈官方服务:
资源简介:
GasVid数据集是一个包含31个视频的气体泄漏视频集,每个视频时长24分钟。该数据集用于训练和测试一种名为FGSTP的算法,该算法旨在对红外视频中的非刚性和模糊物体进行分割。由于原始数据集没有标注,作者手动标注了视频中的气体泄漏区域。该数据集被分为不同的类别,包括近距离清晰背景、中距离清晰背景、近距离复杂背景、远距离清晰背景和远距离复杂背景。每个类别中,一个视频用于训练,另一个视频用于测试。数据集被分为训练集和测试集,其中训练集包含9个视频,测试集包含5个视频。每个视频被分成多个片段,每个片段包含150帧,以加速训练过程。
The GasVid dataset comprises 31 gas leakage infrared videos, each with a duration of 24 minutes. It is employed for training and evaluating the FGSTP algorithm, which is dedicated to segmenting non-rigid and blurry objects in infrared videos. Since the original dataset had no pre-existing annotations, the authors manually annotated the gas leakage regions across all videos. This dataset is classified into five categories: close-range clear background, medium-range clear background, close-range complex background, long-range clear background, and long-range complex background. For each category, one video is assigned for training and another for testing. The entire dataset is split into a training set and a test set, with the training set containing 9 videos and the test set holding 5 videos. To accelerate the training process, each video is divided into multiple segments, each consisting of 150 frames.
提供机构:
不列颠哥伦比亚大学 - 奥肯纳根分校
创建时间:
2025-05-01
搜集汇总
数据集介绍

构建方式
GasVid数据集的构建基于对红外视频中气体泄漏现象的系统性标注。研究团队从31段原始视频中筛选出14段具有代表性的视频,涵盖近距离清晰背景、中距离复杂背景等多种场景,以确保数据集的多样性和挑战性。每段24分钟的视频被分割为150帧的片段,并经过人工逐帧标注以精确标记泄漏区域。通过剔除重复片段和难以辨识的样本,最终形成包含120个训练片段和67个测试片段的平衡数据集,为模型训练提供了高质量的时空标注信息。
特点
该数据集显著特点在于其针对非刚性模糊目标的专业标注体系。气体泄漏在红外成像中呈现无固定形态、边界模糊等特性,传统标注方法难以准确捕捉。GasVid通过专家级人工标注建立了像素级的精细掩模,特别强化了对动态泄漏区域的时空连续性标注。数据集包含不同距离(近/中/远)、不同背景复杂度(清晰/云雾干扰)的多维度场景,其中约42%的样本属于高难度标注案例,为算法鲁棒性验证提供了严格测试基准。
使用方法
使用该数据集时需注重时空特征的联合建模。建议采用论文提出的FGSTP框架中的连续时序关联模块(CTC)提取帧间运动特征,配合细粒度空间感知模块(FSP)增强形态学特征提取。评估应综合S-measure、加权F-measure等五项指标,特别注意长距离复杂背景样本的测试表现。由于涉及红外影像特性,需避免直接迁移RGB域预训练模型,推荐从零开始训练以获得最佳特征表示。数据增强策略应保持气体泄漏的物理运动特性,避免破坏时序连续性。
背景与挑战
背景概述
GasVid数据集由英属哥伦比亚大学奥卡纳根分校的Xinlong Zhao和Shan Du团队于2025年创建,旨在解决红外视频中气体泄漏分割这一关键环境安全问题。该数据集包含31段总时长24分钟的红外监控视频,通过人工逐帧标注泄漏区域,填补了该领域高精度标注数据的空白。作为首个专注于非刚性模糊物体分割的时空感知数据集,GasVid为开发早期气体泄漏预警系统提供了重要研究基础,推动了计算机视觉在工业安全监测领域的应用突破。
当前挑战
气体泄漏分割面临双重挑战:在领域层面,无色无味的气体在红外成像中呈现非刚性形态和模糊纹理,传统光流法和背景建模难以捕捉其随机扩散特性;在数据集构建层面,手动标注需克服低对比度成像下的边界模糊问题,且需处理复杂背景干扰(如云层、飞鸟等相似纹理物体)。此外,工业场景中多变的环境光照和摄像头抖动进一步增加了时空特征提取的难度,要求算法同时具备噪声抑制和微运动感知能力。
常用场景
经典使用场景
GasVid数据集在气体泄漏检测领域具有重要应用,尤其在红外视频监控系统中表现突出。该数据集主要用于训练和评估算法在复杂背景下对无色、无味且形状不规则的气体泄漏进行精确分割的能力。通过结合时空感知技术,GasVid能够有效捕捉气体泄漏的动态特征,为实时监控和早期预警提供可靠支持。
解决学术问题
GasVid数据集解决了气体泄漏分割中的多个关键学术问题,包括非刚性物体的模糊边界分割、动态背景下的噪声干扰消除以及多尺度特征融合。通过提供高质量的手动标注数据,该数据集显著提升了算法在复杂环境中的鲁棒性和准确性,填补了气体泄漏检测领域的数据空白。
衍生相关工作
GasVid数据集推动了多篇经典研究工作的诞生,例如FGSTP算法和SLT-Net模型。这些工作通过引入时空感知模块和边界优化技术,进一步提升了气体泄漏分割的精度。此外,GasVid还激发了红外视频处理领域的新研究方向,如动态背景建模和非刚性物体跟踪。
以上内容由遇见数据集搜集并总结生成



