FireFly

Name: FireFly
Creator: 南加州大学
Published: 2023-08-07 01:19:51
License: 暂无描述

arXiv2023-08-07 更新2024-06-21 收录

下载链接：

https://github.com/ERGOWHO/Firefly2.0.git

下载链接

链接失效反馈

官方服务：

资源简介：

FireFly数据集是由南加州大学创建的合成数据集，用于检测森林火灾中的余烬。该数据集包含19,273张图像，涵盖了多种环境条件，如天气、光照和大气能见度。数据集的创建过程涉及使用虚幻引擎4（UE4）自动生成带有可调参数的标签数据，以增加数据的多样性和定制性。FireFly数据集主要应用于提高机器学习模型在真实世界森林火灾场景中的检测精度，特别是在减少误报和漏报方面。

The FireFly dataset is a synthetic dataset developed by the University of Southern California for detecting embers in forest fires. It consists of 19,273 images covering a wide range of environmental conditions including weather, lighting, and atmospheric visibility. The dataset was created using Unreal Engine 4 (UE4) to automatically generate labeled data with adjustable parameters, thereby enhancing data diversity and customizability. The FireFly dataset is primarily used to improve the detection accuracy of machine learning models in real-world forest fire scenarios, especially in reducing false positives and false negatives.

提供机构：

南加州大学

创建时间：

2023-08-07

搜集汇总

数据集介绍

构建方式

FireFly数据集通过使用Unreal Engine 4（UE4）创建，旨在克服当前缺乏专门用于灰烬检测的训练资源的挑战。该数据集的构建工具允许自动生成带有可调参数的合成标记数据集，从而在各种环境条件下实现数据多样性。具体而言，数据集包括两种不同的森林类型（密集针叶林和枯木森林），并通过调整天气、光照和雾等参数来创建多样化的环境。此外，使用UE4的Niagara粒子系统生成灰烬数据，并通过蓝图和C++脚本定义其三维坐标、大小和粒子数量，最终生成2D边界框作为地面真值。

特点

FireFly数据集具有显著的多样性和可定制性，包含19,273帧图像，涵盖了从燃烧的叶子到火花等多种灰烬类型，以及不同的环境条件如天气、光照和大气可见度。数据集分为正样本（包含灰烬）和负样本（不包含灰烬），其中正样本数量远多于负样本，以提高模型在减少假阴性方面的性能。此外，数据集的多样性通过调整森林类型、灰烬类型、季节、背景和相机角度等参数得以增强，从而丰富了数据集的变异性。

使用方法

FireFly数据集主要用于训练和评估灰烬检测模型。研究者可以使用该数据集来训练各种主流的对象检测模型，如Sparse R-CNN、RetinaNet、DETR和YOLOv7，并通过调整参数来优化模型性能。数据集还支持半自动标注流程，通过训练模型对真实世界中的灰烬帧进行自动标注，从而减少人工干预。此外，数据集的多样性和高分辨率特性使其适用于评估模型在极端测试条件下的表现，并能够推广到真实世界的森林火灾场景中。

背景与挑战

背景概述

近年来，全球范围内频繁发生的极端野火事件，如2023年加拿大野火，已引起广泛关注。特别是加利福尼亚州，作为野火频发地区，其2023年3月20日前的数据显示，已有408起火灾烧毁了131英亩土地。野火的破坏力不仅限于其直接的热辐射，还包括由火前线产生的空中碎片，即灰烬或火种，这些物质能够造成重大损害，甚至超过野火本身的影响。研究表明，灰烬在野地城市交界处的野火中扮演了重要角色，能够远距离传播，增加了预测其轨迹的难度。为了应对这一挑战，FireFly数据集应运而生，由南加州大学等机构的研究人员于2023年创建，旨在通过使用虚幻引擎4（UE4）生成合成数据，解决当前缺乏专门用于灰烬检测的训练资源的问题。该数据集包含19,273帧图像，涵盖了多种环境条件，为开发更有效的野火响应系统提供了基础。

当前挑战

FireFly数据集在构建过程中面临多项挑战。首先，收集真实世界中的野火数据存在显著风险，且难以捕捉到灰烬可能出现的多样环境。其次，手动标注真实实验视频的过程极其耗时。为解决这些问题，研究团队开发了一种工具，允许自动生成带有可调参数的合成标注数据集，从而实现数据多样性。此外，尽管合成数据集在多样性和可定制性方面具有优势，但其与真实数据的差异仍是一个挑战，特别是在模型泛化到真实世界场景时。实验结果表明，尽管合成数据集在某些情况下表现优异，但在处理极端条件下的密集小目标时，现有模型仍面临分辨率不足和目标信息丢失的问题。因此，如何进一步提高合成数据集的质量，使其更接近真实数据，同时保持其多样性和可扩展性，是未来研究的重要方向。

常用场景

经典使用场景

在森林火灾的背景下，FireFly数据集的经典使用场景主要集中在火源检测和火势蔓延预测。通过模拟不同环境条件下的火源和火势，该数据集为研究人员提供了一个多样化的训练平台，以评估和改进现有的火源检测算法。具体应用包括无人机和监控塔上的实时火源检测系统，以及用于预测火势蔓延的智能响应系统。

衍生相关工作

FireFly数据集的发布催生了一系列相关研究工作，特别是在火源检测和火势预测领域。例如，基于FireFly数据集的训练模型被应用于开发更高效的火源检测算法，如YOLOv7的改进版本。此外，该数据集还促进了半自动标注工具的发展，进一步减少了人工标注的工作量，提高了数据处理的效率。

数据集最近研究