FireCastRL Spatiotemporal Wildfire Dataset

Name: FireCastRL Spatiotemporal Wildfire Dataset
Creator: 纽约州立大学布法罗分校·计算机科学与工程系
Published: 2026-01-21 02:50:12
License: 暂无描述

arXiv2026-01-21 更新2026-01-22 收录

下载链接：

https://sites.google.com/view/firecastrl

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由纽约州立大学布法罗分校团队构建，是一个大规模时空野火预测数据集，整合了IRWIN野火事件数据库和GRIDMET气象数据，包含950万条样本，覆盖2014-2025年美国本土的50,720起野火事件及合成的76,080个负样本。数据经过去重、空间平衡和75天时间窗口特征工程处理，包含21项气象与火灾指数特征，如降水量、风速、燃烧指数等。其创新性在于首次将预测性环境变量与强化学习模拟环境相结合，为AI驱动的野火主动防控系统提供训练基础，可支持从早期预警到战术调度的全链条研究。

This dataset was developed by a research team from the University at Buffalo, The State University of New York. It is a large-scale spatiotemporal wildfire prediction dataset that integrates the IRWIN Wildfire Incident Database and GRIDMET meteorological data. The dataset contains 9.5 million samples, covering 50,720 wildfire incidents and 76,080 synthesized negative samples across the contiguous United States from 2014 to 2025. The data has undergone deduplication, spatial balancing, and feature engineering with a 75-day time window, and includes 21 meteorological and fire index features such as precipitation, wind speed, and burning index. Its innovation lies in the first combination of predictive environmental variables and reinforcement learning simulation environments, which provides a training foundation for AI-driven proactive wildfire prevention and control systems, and supports full-chain research ranging from early warning to tactical scheduling.

提供机构：

纽约州立大学布法罗分校·计算机科学与工程系

创建时间：

2026-01-21

搜集汇总

数据集介绍

构建方式

在野火预测研究领域，数据质量直接影响模型的泛化能力。FireCastRL数据集通过整合美国综合野火信息报告系统（IRWIN）的火灾事件记录与GRIDMET高分辨率气象数据构建而成。构建过程采用多阶段过滤策略消除重复报告，确保空间独立性，并通过三级负采样框架生成非火灾样本以平衡类别分布。每个样本包含75天时间窗口的环境变量序列，最终形成950万条标注样本，涵盖降水、风速、燃烧指数等15个关键气象与火灾相关特征。

特点

该数据集的核心特征体现在其时空维度与多源数据融合的完整性。作为大规模时空数据集，它覆盖2014年至2025年美国本土的连续观测，空间分辨率达4公里。数据集不仅包含火灾发生坐标与时间戳，还通过负采样机制构建了空间隔离、时间位移和历史背景三类非火灾场景，有效解决了野火预测中正负样本不平衡的经典难题。多元环境变量的长期序列捕捉了从干旱累积到瞬时气象突变的完整生态过程，为深度学习模型识别复杂点火机制提供了丰富信号。

使用方法

在野火智能管理系统中，该数据集主要支撑预测模型训练与策略验证两阶段任务。研究人员可利用其75天时间窗口序列训练时空预测模型，如论文采用的CNN-LSTM混合架构，实现未来火灾点火的概率评估。对于高风险预测结果，数据集提供的真实地形与气象参数可驱动物理模拟环境构建，进而训练强化学习智能体优化直升机灭火策略。数据集已通过Kaggle平台公开，支持标准化格式加载，可直接用于时间序列分类、风险图谱生成及应急决策仿真等研究场景。

背景与挑战

背景概述

随着全球气候变化加剧，野火发生的频率与强度日益攀升，对生态系统、社区安全及社会经济构成严峻威胁。传统野火管理方法多属被动响应，仅在火灾发生后进行干预，难以有效遏制火势蔓延。在此背景下，美国布法罗大学的研究团队于2025年提出了FireCastRL时空野火数据集，旨在通过整合深度时空建模与强化学习技术，构建一个主动式的野火预测与抑制智能框架。该数据集基于IRWIN事件数据库与GRIDMET气象数据，涵盖了950万个样本，详细记录了火灾发生前后的环境变量序列。其核心研究问题聚焦于实现野火点燃的提前预测与优化空中灭火策略，为灾害响应领域提供了数据驱动的决策支持，推动了人工智能在环境风险管理中的应用前沿。

当前挑战

该数据集致力于解决野火点燃预测与智能抑制策略优化两大领域挑战。在预测层面，模型需从高维时空数据中捕捉火灾发生的复杂模式，但人类活动引发的非气象性火灾增加了预测的不确定性。构建过程中，研究人员面临数据质量与平衡性的双重考验：原始事件数据存在大量重复记录与空间噪声，需通过多阶段过滤确保样本独立性；同时，数据仅包含正例标签，必须设计负采样框架以合成真实的非火灾样本，避免模型因类别失衡而产生偏差。此外，模拟环境的构建需融合真实地形、植被与物理火势蔓延模型，这对计算资源与算法整合提出了较高要求。

常用场景

经典使用场景

在野火预测与管理的学术研究中，FireCastRL数据集因其大规模时空特性而成为经典工具。该数据集整合了美国本土长达十年的环境变量与火灾事件记录，为深度学习模型提供了丰富的训练素材。研究者通常利用其包含的降水、风速、燃料湿度等多元时序特征，构建卷积神经网络与长短期记忆网络结合的混合架构，以精准预测特定区域在未来数日内的火灾起火概率。这种应用不仅验证了数据驱动方法在自然灾害预报中的有效性，还为后续的智能响应策略奠定了数据基础。

实际应用

在实际操作层面，FireCastRL数据集为应急管理部门提供了决策支持。基于数据训练的预测模型可集成至预警平台，帮助机构在火灾高发期前调配资源，如部署直升机消防单位至风险区域。数据集衍生的模拟环境允许演练不同地形条件下的灭火战术，优化人员与装备的使用效率。这些应用不仅缩短了应急响应时间，还降低了灭火成本与生态损失，体现了人工智能技术在提升公共安全与资源管理效能方面的实用价值。

衍生相关工作

围绕该数据集，学术界已衍生出多项经典研究工作。例如，有研究借鉴其时空框架开发了基于Transformer的火灾蔓延预测模型，提升了长期序列的建模精度。另有团队利用数据集中的物理参数构建了多智能体强化学习环境，模拟地面与空中协同灭火的复杂策略。这些工作扩展了数据集的用途，促进了跨学科合作，并催生了新的基准测试与算法比较，持续推动着智能灾害响应领域的创新与发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集