five

GasVid|视频处理数据集|气体泄漏检测数据集

收藏
arXiv2025-05-01 更新2025-05-13 收录
视频处理
气体泄漏检测
下载链接:
http://arxiv.org/abs/2505.00295v1
下载链接
链接失效反馈
资源简介:
GasVid数据集是一个包含31个视频的气体泄漏视频集,每个视频时长24分钟。该数据集用于训练和测试一种名为FGSTP的算法,该算法旨在对红外视频中的非刚性和模糊物体进行分割。由于原始数据集没有标注,作者手动标注了视频中的气体泄漏区域。该数据集被分为不同的类别,包括近距离清晰背景、中距离清晰背景、近距离复杂背景、远距离清晰背景和远距离复杂背景。每个类别中,一个视频用于训练,另一个视频用于测试。数据集被分为训练集和测试集,其中训练集包含9个视频,测试集包含5个视频。每个视频被分成多个片段,每个片段包含150帧,以加速训练过程。
提供机构:
不列颠哥伦比亚大学 - 奥肯纳根分校
创建时间:
2025-05-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
GasVid数据集的构建基于对红外视频中气体泄漏现象的系统性标注。研究团队从31段原始视频中筛选出14段具有代表性的视频,涵盖近距离清晰背景、中距离复杂背景等多种场景,以确保数据集的多样性和挑战性。每段24分钟的视频被分割为150帧的片段,并经过人工逐帧标注以精确标记泄漏区域。通过剔除重复片段和难以辨识的样本,最终形成包含120个训练片段和67个测试片段的平衡数据集,为模型训练提供了高质量的时空标注信息。
特点
该数据集显著特点在于其针对非刚性模糊目标的专业标注体系。气体泄漏在红外成像中呈现无固定形态、边界模糊等特性,传统标注方法难以准确捕捉。GasVid通过专家级人工标注建立了像素级的精细掩模,特别强化了对动态泄漏区域的时空连续性标注。数据集包含不同距离(近/中/远)、不同背景复杂度(清晰/云雾干扰)的多维度场景,其中约42%的样本属于高难度标注案例,为算法鲁棒性验证提供了严格测试基准。
使用方法
使用该数据集时需注重时空特征的联合建模。建议采用论文提出的FGSTP框架中的连续时序关联模块(CTC)提取帧间运动特征,配合细粒度空间感知模块(FSP)增强形态学特征提取。评估应综合S-measure、加权F-measure等五项指标,特别注意长距离复杂背景样本的测试表现。由于涉及红外影像特性,需避免直接迁移RGB域预训练模型,推荐从零开始训练以获得最佳特征表示。数据增强策略应保持气体泄漏的物理运动特性,避免破坏时序连续性。
背景与挑战
背景概述
GasVid数据集由英属哥伦比亚大学奥卡纳根分校的Xinlong Zhao和Shan Du团队于2025年创建,旨在解决红外视频中气体泄漏分割这一关键环境安全问题。该数据集包含31段总时长24分钟的红外监控视频,通过人工逐帧标注泄漏区域,填补了该领域高精度标注数据的空白。作为首个专注于非刚性模糊物体分割的时空感知数据集,GasVid为开发早期气体泄漏预警系统提供了重要研究基础,推动了计算机视觉在工业安全监测领域的应用突破。
当前挑战
气体泄漏分割面临双重挑战:在领域层面,无色无味的气体在红外成像中呈现非刚性形态和模糊纹理,传统光流法和背景建模难以捕捉其随机扩散特性;在数据集构建层面,手动标注需克服低对比度成像下的边界模糊问题,且需处理复杂背景干扰(如云层、飞鸟等相似纹理物体)。此外,工业场景中多变的环境光照和摄像头抖动进一步增加了时空特征提取的难度,要求算法同时具备噪声抑制和微运动感知能力。
常用场景
经典使用场景
GasVid数据集在气体泄漏检测领域具有重要应用,尤其在红外视频监控系统中表现突出。该数据集主要用于训练和评估算法在复杂背景下对无色、无味且形状不规则的气体泄漏进行精确分割的能力。通过结合时空感知技术,GasVid能够有效捕捉气体泄漏的动态特征,为实时监控和早期预警提供可靠支持。
解决学术问题
GasVid数据集解决了气体泄漏分割中的多个关键学术问题,包括非刚性物体的模糊边界分割、动态背景下的噪声干扰消除以及多尺度特征融合。通过提供高质量的手动标注数据,该数据集显著提升了算法在复杂环境中的鲁棒性和准确性,填补了气体泄漏检测领域的数据空白。
衍生相关工作
GasVid数据集推动了多篇经典研究工作的诞生,例如FGSTP算法和SLT-Net模型。这些工作通过引入时空感知模块和边界优化技术,进一步提升了气体泄漏分割的精度。此外,GasVid还激发了红外视频处理领域的新研究方向,如动态背景建模和非刚性物体跟踪。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

CMNEE(Chinese Military News Event Extraction dataset)

CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。

github 收录

qm8, qm9

qm8和qm9是用于分子属性预测的数据集,这些数据集通常用于机器学习和深度学习模型中,以预测分子的各种化学性质。

github 收录

中国30m土地利用数据集(1990-2020年)

数据以美国陆地卫星Landsat遥感影像作为主要信息源,通过人工目视解译构建的中国国家尺度多时期土地利用/土地覆盖专题数据库数据采用二级分类系统,一级分为耕地、林地、草地、水域、建设用地和未利用土地6类,二级在一级类型基础上进一步分为25个类型

国家地球系统科学数据中心 收录