wildfire-korea-episodes-300m

Hugging Face2025-12-08 更新2025-12-09 收录

下载链接：

https://huggingface.co/datasets/chaseungjoon/wildfire-korea-episodes-300m

下载链接

链接失效反馈

官方服务：

资源简介：

韩国野火事件数据集（300米网格）是一个结合了NASA FIRMS (VIIRS/MODIS)火点探测数据和静态环境层（如DEM、土地覆盖、坡度、NDVI、森林结构等）的地理空间数据集。数据以300米空间网格预处理，并分割成适合基于强化学习的野火蔓延预测研究的时间序列事件。每个事件包含时间序列的环境特征张量（16个通道）、每个时间步对应的火势蔓延掩码、预归一化和对齐的地理空间层，以及基于FIRMS时空聚类的事件分割。数据集支持训练如A3C-LSTM等强化学习野火蔓延预测模型。

创建时间：

2025-12-04

原始信息汇总

韩国山火事件数据集（300米网格）概述

数据集基本信息

名称：South Korean Wildfire Episodes Dataset (300 m Grid)
许可协议：mit
主要语言：en
数据规模：1K<n<10K
空间覆盖范围：朝鲜半岛
时间覆盖范围：2015年至2025年

数据集内容与结构

该数据集是一个结合了NASA FIRMS (VIIRS/MODIS) 火点探测数据与静态环境层（DEM、土地覆盖、坡度、NDVI、森林结构等）的韩国山火发展地理空间数据集。数据被预处理为300米空间网格，并根据时间分割为适合基于强化学习的山火蔓延预测研究的山火事件。

每个事件存储为一个压缩的.npz文件，结构如下：

states：形状为(T, 16, 30, 30)，表示随时间变化的环境特征网格张量。
fire_masks：形状为(T, 30, 30)，表示二值化的山火蔓延掩膜。

其中：

T 代表事件中的时间步数。
16个通道包括：
- DEM（高程、坡度、坡向）
- 天气（温度、湿度、风速、风向、降水、气压、云量、能见度、露点）
- NDVI
- FSM（森林易感性或分类森林类型通道）

数据预处理流程

收集2015年至2025年的FIRMS VIIRS/MODIS火点探测数据。
应用滑动窗口扫描聚类方法，将探测数据分组为独立的山火事件。
将所有地理空间图层重采样至300米网格分辨率。
将静态图层嵌入为多通道栅格瓦片。
从以下内容构建事件.npz文件：
- 源自FIRMS的火点掩膜序列
- 每个时间步的环境特征张量

预期用途

该数据集专为以下用途设计：

强化学习山火蔓延模型（A3C、A2C、基于LSTM的智能体）
时空预测研究
地理空间机器学习和不确定性建模
与CNN/LSTM/U-Net山火模型的对比实验

局限性

FIRMS探测数据存在时间间隙和位置不确定性。
环境特征聚合至300米分辨率。
事件分割依赖于聚类阈值。
未经额外校准，该数据集不适用于业务化的山火预报。

引用信息

如果使用此数据集，请引用：

Cha, S.J. (2025). Korean Peninsula Wildfire Episodes Dataset (300 m Grid). WildFirePrediction Project, Chung-Ang University.

搜集汇总

数据集介绍

构建方式

在野火蔓延预测研究领域，构建高质量的地理空间数据集是推动模型发展的关键。本数据集通过整合NASA FIRMS系统提供的VIIRS/MODIS火点探测数据与多种静态环境图层，包括数字高程模型、土地覆盖类型、坡度、归一化植被指数及森林结构参数等，构建了一个覆盖朝鲜半岛的野火事件序列。采用滑动窗口扫描聚类算法，将2015年至2025年间的火点探测数据按时空连续性分割为独立的野火事件，所有地理空间图层统一重采样至300米网格分辨率，并嵌入为多通道栅格瓦片，最终以压缩的.npz格式存储每个事件的环境特征张量与火势掩码序列。

特点

该数据集的核心特点在于其精细的时空结构与多源数据融合。每个野火事件被表征为时序环境特征张量与对应的二值火势蔓延掩码，其中环境特征包含16个通道，涵盖了地形、气象及植被等多维信息，空间维度固定为30×30网格。数据集经过预归一化与对齐处理，确保了模型输入的标准化与一致性。特别地，事件分割基于FIRMS探测的时空聚类，使得数据天然适用于强化学习等序列决策任务的训练，为野火蔓延的动态模拟提供了高保真的时空上下文。

使用方法

在应用层面，本数据集专为基于强化学习的野火蔓延预测模型设计，如A3C-LSTM等架构。研究人员可直接加载.npz文件，提取状态序列与火势掩码，作为智能体与环境交互的基础。数据集支持时空预测、地理空间机器学习及不确定性建模等研究方向，可用于训练卷积神经网络、长短期记忆网络或U-Net等模型，进行野火蔓延的模拟与比较实验。需要注意的是，由于FIRMS探测存在时空间隙与位置不确定性，该数据集更侧重于研究验证，而非直接用于业务化野火预报。

背景与挑战

背景概述

随着全球气候变化加剧，野火频发已成为威胁生态安全与社会稳定的重大环境问题。韩国半岛因其独特的季风气候与森林分布，野火动态研究具有重要区域代表性。2025年，韩国中央大学的研究团队发布了wildfire-korea-episodes-300m数据集，旨在为基于强化学习的野火蔓延预测模型提供标准化时空序列数据。该数据集整合了NASA FIRMS系统的火点探测数据与多源环境静态图层，覆盖2015年至2025年的观测时段，以300米空间网格分辨率构建了连贯的野火事件片段。其核心研究问题聚焦于如何利用高维环境特征与火势演变序列，训练能够模拟复杂火场行为的智能体模型，为地理空间人工智能在灾害管理领域的应用提供了关键数据基础。

当前挑战

在野火蔓延预测领域，模型需克服环境异质性、时空动态非线性以及数据不确定性等多重挑战。该数据集针对的领域问题在于如何从多源异构数据中提取有效特征，以支持强化学习智能体在复杂地形与气象条件下的决策泛化能力。构建过程中，研究人员面临FIRMS火点探测数据存在时空间隙与定位偏差的固有局限，需通过滑动窗口聚类算法进行事件分割，其阈值选择直接影响片段连贯性。同时，将高程、植被指数、气象参数等多维度环境图层统一重采样至300米网格，涉及空间对齐与特征归一化的技术难题，且静态图层的时间分辨率不足可能削弱动态过程的表征精度。

常用场景

经典使用场景

在野火蔓延预测领域，该数据集为强化学习模型提供了标准化的训练与评估环境。其将韩国半岛的野火事件序列化为时空网格，每个片段包含多通道环境特征与对应的火势掩码，使得研究者能够直接构建基于A3C-LSTM等架构的智能体，模拟火势在复杂地形与气象条件下的动态传播过程。这种结构化表示不仅简化了数据预处理流程，还促进了模型在连续决策任务中的端到端学习。

实际应用

在实际防灾减灾工作中，该数据集支撑的模型可用于辅助制定火势蔓延的应急响应策略。通过模拟不同环境条件下的火行为，能够评估潜在风险区域，优化资源调配方案。尽管数据集本身不直接用于业务化预报，但其衍生的预测模型可为韩国半岛的森林管理部门提供决策参考，提升对野火动态的预见性与防控效率。

衍生相关工作

围绕该数据集，已催生了一系列基于深度学习的野火蔓延预测研究。经典工作包括结合A3C算法与LSTM网络的强化学习智能体，用于学习火势传播的时序依赖；此外，卷积神经网络与U-Net架构也被应用于从环境特征中提取空间模式，进行火势范围的短临预测。这些研究共同推进了地理空间人工智能在自然灾害模拟领域的交叉创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集