MMFire

Name: MMFire
Creator: 瑞典皇家理工学院
Published: 2026-03-21 01:59:15
License: 暂无描述

arXiv2026-03-21 更新2026-03-24 收录

下载链接：

https://github.com/SebastianGer/wildfire-spread-scenarios

下载链接

链接失效反馈

官方服务：

资源简介：

MMFire是由瑞典皇家理工学院团队基于Simfire模拟器开发的新型野火蔓延多模态数据集，旨在解决野火预测中的多结果生成问题。该数据集通过LANDFIRE程序获取真实地理数据，模拟不同环境条件下（如燃料状况、地形）的野火扩散路径，生成具有空间多样性的分割掩码。其数据特点包括初始燃烧区域重叠但后续扩散模式分异，适用于训练扩散模型以探索低概率但操作相关的火灾场景。该数据集主要应用于灾害响应决策支持系统，为生成对抗性野火蔓延预测提供基准。

MMFire is a novel multi-modal wildfire spread dataset developed by the team from KTH Royal Institute of Technology based on the Simfire simulator, which aims to address the multi-outcome generation problem in wildfire prediction. This dataset acquires real-world geographic data via the LANDFIRE program, simulates wildfire spread paths under various environmental conditions (e.g., fuel conditions, terrain), and generates spatially diverse segmentation masks. Its data characteristics include overlapping initial combustion areas but divergent subsequent spread patterns, making it suitable for training diffusion models to explore low-probability but operationally relevant fire scenarios. This dataset is mainly applied in disaster response decision support systems, providing a benchmark for generating adversarial wildfire spread predictions.

提供机构：

瑞典皇家理工学院

创建时间：

2026-03-21

原始信息汇总

数据集概述

数据集名称

MMFire

数据集类型

模糊分割数据集

核心特征

该数据集为模糊分割数据集，意味着每个输入对应多个可能的输出。
数据集中分割掩码的多样性并非真实，仅作为评估模糊分割任务的工具。
数据集基于模拟环境生成，用于预测给定输入数据下的野火蔓延情况。

数据来源与生成

数据集由模拟环境 SimFire by MITRE 生成。
在代码中，数据集与术语 simfire 关联。
在论文中，发布的数据集命名为 MMFire。

获取方式

数据集下载地址：https://doi.org/10.5281/zenodo.18037549

使用说明

在自有代码中使用该数据集，可调用 Lightning Datamodule：src/firespreadscenarios/dataloader/SimfireDataModule.py，该模块直接提供训练集/验证集/测试集的数据加载器。
由于用于预测野火蔓延的模拟器是一个相对简单的计算机程序，深度学习模型应能较好地学习近似此映射关系。这与现实世界的观测有显著差异，在现实世界中不存在如此简单的关系，且深度学习模型目前表现较差。

引用

@inproceedings{ gerard2025wildfire, title={Wildfire Spread Scenarios: Increasing Sample Diversity of Segmentation Diffusion Models with Training-Free Methods}, author={Sebastian Gerard and Josephine Sullivan}, booktitle={Northern Lights Deep Learning Conference 2026}, year={2025}, url={https://openreview.net/forum?id=E44d5hzEV0} }

搜集汇总

数据集介绍

构建方式

在野火蔓延预测这一充满不确定性的领域中，MMFire数据集的构建采用了基于仿真的方法，以生成多模态的未来情景。该数据集借助Simfire仿真器，从美国西部的真实地理位置获取LANDFIRE项目提供的燃料条件、地形等关键环境数据。针对每个初始火情状态，通过固定模拟区域内的风向为八个不同角度（间隔45度），从同一初始状态分支模拟出八种不同的未来十分钟火势蔓延结果，从而为每个输入条件创建了八个具有明确概率分布（呈现高度偏斜分布）的二进制分割掩码目标，以此构建了一个包含9608个样本的基准数据集，专门用于评估模型在高度不确定环境下生成多样且合理未来情景的能力。

特点

MMFire数据集的核心特点在于其人为构建的多模态与高度偏斜的概率分布。每个输入样本对应八个由不同风向决定的仿真未来火势掩码，这些掩码在初始燃烧区域重叠，但后续蔓延形态存在中等程度的差异，模拟了野火蔓延中因主导环境因素（如风向）变化而产生的多种合理可能性。数据集特意为这八种模式设定了以2^i加权的非均匀概率，创造了极具挑战性的评估环境，使得通过朴素采样找到所有模式的期望样本数高达约307次，从而精准地聚焦于评估生成模型在探索低概率但操作上相关情景时的样本效率与多样性。

使用方法

MMFire数据集主要用于训练和评估能够处理歧义分割任务的生成模型，特别是在需要预测多种可能未来的场景中。在使用时，模型以当前的火灾状态（如红外图像）及其他辅助数据作为条件输入，但无法获取决定不同模式的关键变量（如风向）。研究通常在该数据集上训练条件扩散模型，然后在推理阶段使用朴素采样或多样偏向采样方法（如粒子引导、SPELL或基于聚类的剪枝策略）来生成多个不同的分割掩码。评估时采用匈牙利匹配交并比等指标，衡量模型生成样本的多样性与质量，以及其覆盖所有已知地面实况模式的能力，为开发面向灾害响应的决策支持系统提供基础。

背景与挑战

背景概述

MMFire数据集由瑞典皇家理工学院的研究团队于2026年提出，旨在解决野火蔓延预测中的多模态不确定性建模问题。该数据集基于Simfire模拟器生成，结合LANDFIRE提供的真实地理环境数据，模拟了在不同风向条件下野火蔓延的多种可能情景。其核心研究问题在于如何从单一初始状态生成多个合理的未来分割掩码，以应对环境因素（如风速、燃料条件）的不确定性，从而为灾害响应决策提供支持。该数据集的引入推动了生成式扩散模型在模糊分割任务中的应用，特别是在处理低概率但操作相关的情景方面，为相关领域提供了重要的基准测试平台。

当前挑战

MMFire数据集主要挑战体现在两方面：首先，在领域问题层面，该数据集致力于解决野火蔓延预测中的多模态分割问题，即从单一输入生成多个合理且多样的分割掩码，以覆盖不确定环境下的不同可能结果。这一任务要求模型能够有效捕捉并生成低概率但关键的模式，避免采样冗余，同时保持输出质量。其次，在构建过程中，数据集面临模拟真实性与多样性平衡的挑战：基于物理模拟的生成方式虽能提供可控的多模态数据，但模拟参数（如风向）的离散化设置可能限制了结果的连续变化范围；此外，数据集中人为设定的高度偏态概率分布（如对八种风向赋予指数权重）增加了模型学习与采样过程中发现所有模式的难度，对采样效率提出了更高要求。

常用场景

经典使用场景

在野火蔓延预测领域，MMFire数据集为研究多模态扩散模型提供了关键基准。该数据集通过Simfire模拟器生成，基于真实地理数据与Rothermel方程，为每个初始火灾状态创建了八种不同风向下的未来蔓延情景。其经典使用场景在于评估扩散模型在模糊分割任务中的样本多样性生成能力，特别是在处理高度偏态分布时，模型能否高效捕捉所有潜在模式，包括低概率但操作上相关的罕见情景。

衍生相关工作

围绕MMFire数据集，衍生出了一系列关于多样性采样方法的经典研究。论文中重点评估了粒子引导和SPELL等无需训练的技术，这些方法最初为自然图像生成设计，后被适配到离散分割任务中。此外，基于聚类的剪枝策略也被提出，以减少冗余样本并提升输出保真度。这些工作不仅推动了模糊分割领域的发展，还为医学影像分析、城市场景理解等跨领域任务提供了可迁移的框架，促进了生成式模型在不确定性环境中的广泛应用。

数据集最近研究

MMFire

数据集概述

数据集名称

数据集类型

核心特征

数据来源与生成

获取方式

使用说明

相关实验

引用