five

LangGas

收藏
arXiv2025-03-06 更新2025-03-08 收录
下载链接:
https://forms.gle/aPHPfnM4Lwaz9FKB8
下载链接
链接失效反馈
资源简介:
LangGas数据集是由加拿大不列颠哥伦比亚大学的研究团队创建的,该数据集具有多样化的背景、干扰性前景物体、多样的泄漏位置和精确的分割地面真实情况。数据集通过在背景场景上叠加干扰前景物体和气体泄漏模拟视频来构建。该数据集旨在用于半透明气体泄漏检测,结合背景减法和零样本目标检测等技术的选择性零样本方法。数据集包含了多种场景,通过计算机生成,避免了人为标注的不准确性和效率问题,同时保证了精确的分割标注。

The LangGas dataset was created by a research team from the University of British Columbia, Canada. This dataset features diverse backgrounds, interfering foreground objects, varied leak locations, and precise segmentation ground truths. It is constructed by overlaying interfering foreground objects and simulated gas leak videos onto background scenes. This dataset is designed for translucent gas leak detection, targeting selective zero-shot methods that integrate technologies such as background subtraction and zero-shot object detection. The dataset comprises multiple computer-generated scenes, which eliminates the inaccuracies and efficiency drawbacks of manual annotation while ensuring accurate segmentation annotations.
提供机构:
加拿大不列颠哥伦比亚大学
创建时间:
2025-03-04
AI搜集汇总
数据集介绍
main_image_url
构建方式
LangGas数据集的构建方式涉及将模拟的前景对象和气体泄漏仿真视频叠加到不同的背景场景中。前景元素从BU-TIV和CAMEL两个红外数据集中获取,并使用阈值分割或SAM 2模型进行分割。背景视频从GasVid数据集中未泄漏部分选取,或使用DALL-E-2生成。气体泄漏模拟使用Blender软件的烟雾模拟和力场渲染。为了获得精确的分割真值,使用与叠加位置相同的生成的“烟雾”视频。LangGas数据集避免了人类标注,并保留了精确的分割结果,通过将逼真的渲染泄漏和干扰的前景元素叠加到不同的背景上,生产高质量的数据。
使用方法
LangGas数据集的使用方法包括背景减除、VLM过滤、时间过滤和分割。首先,使用背景减除方法提取视频中的移动部分。然后,利用VLM的零样本对象检测能力过滤感兴趣的对象(泄漏),并使用SAM 2模型生成分割掩码。此外,为了解决VLM缺乏时间信息的局限性,引入了时间过滤机制,确保检测到的框在过去一段时间内持续存在,从而减少瞬时的误报和漏报。
背景与挑战
背景概述
在工业和日常生活中,气体泄漏是一个严重的问题,需要有效的检测方法。传统上,人类检查是一种缓慢且劳动密集型的过程。近年来,机器学习技术被应用于此问题,但高质量、公开可用的数据集仍然稀缺。本文介绍了一个具有多样化背景、干扰前景物体、多样化泄漏位置和精确分割真值的人工合成数据集。我们提出了一种零样本方法,该方法结合了背景减法、零样本物体检测、过滤和分割,以利用这个数据集。实验结果表明,我们的方法在整体IoU方面显著优于仅基于背景减法和零样本物体检测与分割的基线方法,达到69%。我们还对各种提示配置和阈值设置进行了分析,以更深入地了解我们方法的表现。数据集可在https://forms.gle/aPHPfnM4Lwaz9FKB8获得。
当前挑战
气体泄漏检测领域的主要挑战包括:1) 缺乏高质量、公开可用的数据集;2) 气体泄漏的半透明、模糊边界使得人工标注困难;3) 现有数据集可能存在空间偏差,例如特定释放装置的位置;4) 现有数据集可能受到相机类型、位置和光照等因素的影响;5) 零样本技术在实际应用中的鲁棒性有待提高。
常用场景
经典使用场景
LangGas数据集是一个合成数据集,它具有多样化的背景、干扰的前景物体、多样化的泄漏位置以及精确的分割标注。该数据集旨在解决半透明气体泄漏检测中的问题,特别是在红外图像中进行前景(泄漏)分割。经典使用场景包括背景减除、零样本目标检测、过滤和分割。首先,使用背景减除来识别视频中的移动部分。然后,利用两个文本提示(正负提示)来引导零样本目标检测器检测泄漏。我们使用“白色蒸汽”作为提示,因为它比明确提及气体泄漏的短语更常被识别。接着,应用非最大值抑制(NMS)和时间过滤来去除多余的框,并根据过去的时序信息修复假阳性或假阴性。最后,使用分割模型(例如Segment Anything Model 2(SAM 2))将边界框转换为分割掩码。
解决学术问题
LangGas数据集解决了气体泄漏检测中存在的几个常见学术研究问题。首先,它提供了高质量的、公开可用的数据集,这对于机器学习方法至关重要。其次,它通过计算机生成的数据避免了人工标注的效率低下和准确性问题。此外,LangGas数据集具有精确的分割标注,这对于评估分割性能至关重要。最后,该数据集通过结合背景减除、零样本目标检测、过滤和分割,提出了一种新的基准算法,可以准确地对气体泄漏进行分割。
实际应用
LangGas数据集的实际应用场景包括工业、能源和环境保护等领域。在工业领域,该数据集可以用于检测工厂和管道中的气体泄漏,从而避免安全事故和环境危害。在能源领域,该数据集可以用于检测天然气和石油等燃料的泄漏,从而提高能源利用效率。在环境保护领域,该数据集可以用于监测温室气体排放,从而减少对环境的影响。
数据集最近研究
最新研究方向
LangGas数据集的引入为半透明气体泄漏检测提供了新的研究方向。该数据集结合了背景减除、零样本目标检测、过滤和分割等技术在零样本场景下进行半透明气体泄漏检测。实验结果表明,该数据集的方法显著优于仅基于背景减除和零样本目标检测的分割方法。此外,该研究还分析了各种提示配置和阈值设置,以更深入地了解该方法的表现。LangGas数据集的推出,不仅为气体泄漏检测领域提供了高质量、公开可用的数据集,而且推动了零样本学习技术在气体泄漏检测中的应用,为未来的研究提供了新的思路和方向。
相关研究论文
  • 1
    LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset加拿大不列颠哥伦比亚大学 · 2025年
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作