five

LangGas|计算机视觉数据集|气体泄漏检测数据集

收藏
arXiv2025-03-06 更新2025-03-08 收录
计算机视觉
气体泄漏检测
下载链接:
https://forms.gle/aPHPfnM4Lwaz9FKB8
下载链接
链接失效反馈
资源简介:
LangGas数据集是由加拿大不列颠哥伦比亚大学的研究团队创建的,该数据集具有多样化的背景、干扰性前景物体、多样的泄漏位置和精确的分割地面真实情况。数据集通过在背景场景上叠加干扰前景物体和气体泄漏模拟视频来构建。该数据集旨在用于半透明气体泄漏检测,结合背景减法和零样本目标检测等技术的选择性零样本方法。数据集包含了多种场景,通过计算机生成,避免了人为标注的不准确性和效率问题,同时保证了精确的分割标注。
提供机构:
加拿大不列颠哥伦比亚大学
创建时间:
2025-03-04
AI搜集汇总
数据集介绍
main_image_url
构建方式
LangGas数据集的构建方式涉及将模拟的前景对象和气体泄漏仿真视频叠加到不同的背景场景中。前景元素从BU-TIV和CAMEL两个红外数据集中获取,并使用阈值分割或SAM 2模型进行分割。背景视频从GasVid数据集中未泄漏部分选取,或使用DALL-E-2生成。气体泄漏模拟使用Blender软件的烟雾模拟和力场渲染。为了获得精确的分割真值,使用与叠加位置相同的生成的“烟雾”视频。LangGas数据集避免了人类标注,并保留了精确的分割结果,通过将逼真的渲染泄漏和干扰的前景元素叠加到不同的背景上,生产高质量的数据。
使用方法
LangGas数据集的使用方法包括背景减除、VLM过滤、时间过滤和分割。首先,使用背景减除方法提取视频中的移动部分。然后,利用VLM的零样本对象检测能力过滤感兴趣的对象(泄漏),并使用SAM 2模型生成分割掩码。此外,为了解决VLM缺乏时间信息的局限性,引入了时间过滤机制,确保检测到的框在过去一段时间内持续存在,从而减少瞬时的误报和漏报。
背景与挑战
背景概述
在工业和日常生活中,气体泄漏是一个严重的问题,需要有效的检测方法。传统上,人类检查是一种缓慢且劳动密集型的过程。近年来,机器学习技术被应用于此问题,但高质量、公开可用的数据集仍然稀缺。本文介绍了一个具有多样化背景、干扰前景物体、多样化泄漏位置和精确分割真值的人工合成数据集。我们提出了一种零样本方法,该方法结合了背景减法、零样本物体检测、过滤和分割,以利用这个数据集。实验结果表明,我们的方法在整体IoU方面显著优于仅基于背景减法和零样本物体检测与分割的基线方法,达到69%。我们还对各种提示配置和阈值设置进行了分析,以更深入地了解我们方法的表现。数据集可在https://forms.gle/aPHPfnM4Lwaz9FKB8获得。
当前挑战
气体泄漏检测领域的主要挑战包括:1) 缺乏高质量、公开可用的数据集;2) 气体泄漏的半透明、模糊边界使得人工标注困难;3) 现有数据集可能存在空间偏差,例如特定释放装置的位置;4) 现有数据集可能受到相机类型、位置和光照等因素的影响;5) 零样本技术在实际应用中的鲁棒性有待提高。
常用场景
经典使用场景
LangGas数据集是一个合成数据集,它具有多样化的背景、干扰的前景物体、多样化的泄漏位置以及精确的分割标注。该数据集旨在解决半透明气体泄漏检测中的问题,特别是在红外图像中进行前景(泄漏)分割。经典使用场景包括背景减除、零样本目标检测、过滤和分割。首先,使用背景减除来识别视频中的移动部分。然后,利用两个文本提示(正负提示)来引导零样本目标检测器检测泄漏。我们使用“白色蒸汽”作为提示,因为它比明确提及气体泄漏的短语更常被识别。接着,应用非最大值抑制(NMS)和时间过滤来去除多余的框,并根据过去的时序信息修复假阳性或假阴性。最后,使用分割模型(例如Segment Anything Model 2(SAM 2))将边界框转换为分割掩码。
解决学术问题
LangGas数据集解决了气体泄漏检测中存在的几个常见学术研究问题。首先,它提供了高质量的、公开可用的数据集,这对于机器学习方法至关重要。其次,它通过计算机生成的数据避免了人工标注的效率低下和准确性问题。此外,LangGas数据集具有精确的分割标注,这对于评估分割性能至关重要。最后,该数据集通过结合背景减除、零样本目标检测、过滤和分割,提出了一种新的基准算法,可以准确地对气体泄漏进行分割。
实际应用
LangGas数据集的实际应用场景包括工业、能源和环境保护等领域。在工业领域,该数据集可以用于检测工厂和管道中的气体泄漏,从而避免安全事故和环境危害。在能源领域,该数据集可以用于检测天然气和石油等燃料的泄漏,从而提高能源利用效率。在环境保护领域,该数据集可以用于监测温室气体排放,从而减少对环境的影响。
数据集最近研究
最新研究方向
LangGas数据集的引入为半透明气体泄漏检测提供了新的研究方向。该数据集结合了背景减除、零样本目标检测、过滤和分割等技术在零样本场景下进行半透明气体泄漏检测。实验结果表明,该数据集的方法显著优于仅基于背景减除和零样本目标检测的分割方法。此外,该研究还分析了各种提示配置和阈值设置,以更深入地了解该方法的表现。LangGas数据集的推出,不仅为气体泄漏检测领域提供了高质量、公开可用的数据集,而且推动了零样本学习技术在气体泄漏检测中的应用,为未来的研究提供了新的思路和方向。
相关研究论文
  • 1
    LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset加拿大不列颠哥伦比亚大学 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

UAV123

从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。

OpenDataLab 收录

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录