five

加利福尼亚野火清单(CAWFI)

收藏
arXiv2025-09-14 更新2025-11-21 收录
下载链接:
https://github.com/rohan-tan-bhowmik/CAWFI-Data
下载链接
链接失效反馈
官方服务:
资源简介:
加利福尼亚野火清单(CAWFI)是一个包含超过3700万个数据点的野火数据库,旨在为基于人工智能的预测技术提供支持。该数据集收集了2012年至2018年间加利福尼亚州的历史野火数据以及2012年至2022年的气象和地质数据。数据集包含了指示野火易发条件的气象数据、指示先前和早期野火活动的环境数据,以及决定野火风险和传播模式的植被和海拔数据。CAWFI已被证明能够成功地训练时空人工智能模型,预测未来超过30万英亩的野火。该数据集旨在促进野火预测研究和解决方案的发展,并为未来其他地区的野火数据库树立先例。

The California Wildfire Inventory (CAWFI) is a wildfire database containing over 37 million data points, designed to support AI-based prediction technologies. This dataset collects historical wildfire data for California between 2012 and 2018, as well as meteorological and geological data spanning from 2012 to 2022. The dataset includes meteorological data indicating wildfire-prone conditions, environmental data signaling prior and early wildfire activity, and vegetation and elevation data that determine wildfire risk and spread patterns. CAWFI has been proven to successfully train spatiotemporal AI models for forecasting wildfires covering more than 300,000 acres. This dataset aims to promote wildfire prediction research and the development of relevant solutions, while setting a precedent for future wildfire databases in other regions.
提供机构:
斯坦福大学, 哈佛大学公共卫生学院, 德克萨斯大学健康科学中心
创建时间:
2025-09-14
搜集汇总
数据集介绍
main_image_url
构建方式
在应对日益严峻的野火威胁背景下,加利福尼亚野火清单(CAWFI)通过整合多源异构数据构建而成。该数据集系统汇集了2012至2018年加州历史野火数据与2012至2022年的三类关键指标:包括气象数据等先导指标、环境监测数据等滞后指标,以及植被指数与高程数据等地质指标。数据采集依托分布式遥感传感器网络,采用375×375米网格化空间分区,通过热力图形式呈现每日野火活动与指标变化,最终形成超过3700万个数据点的时空数据库。
使用方法
该数据集主要服务于基于人工智能的野火预测研究,使用者可通过公开仓库获取原始CSV/SQL格式数据及配套处理代码。研究实践表明,采用U-Convolutional-LSTM等时空神经网络架构时,将2012-2017年指标数据作为训练集,可实现对2018年野火季的精准预测。具体流程包括:解析野火日期位置信息生成热力图,对气象环境数据进行线性插值处理,提取地质数据色调特征,最终通过多源数据融合构建端到端的野火风险预测模型。
背景与挑战
背景概述
加利福尼亚野火清单(CAWFI)由斯坦福大学、哈佛大学等机构的科研团队于2023年联合创建,旨在应对气候变化引发的日益严峻的野火威胁。该数据集整合了2012至2018年的历史野火数据及2012至2022年的多维指标数据,覆盖气象、环境和地质三大类共37百万个数据点。其核心研究问题聚焦于通过人工智能技术实现野火的精准预测,突破传统依赖事后检测的局限,为预防特大火灾提供数据支撑。该数据集已成功应用于时空AI模型训练,预测准确率达85.7%,显著推动了生态安全与灾害防控领域的研究进程。
当前挑战
在解决野火预测领域问题时,CAWFI面临的主要挑战包括:如何从复杂多维指标中提取有效的时空特征以提升模型泛化能力,以及如何平衡预测精度与实时性要求以应对快速蔓延的闪燃火灾。在数据构建过程中,需克服历史野火数据标注不完整、跨区域传感器网络数据异构性整合困难,以及地质指标长期动态更新的技术瓶颈。此外,卫星数据重访周期长达两日与实时预测需求间的矛盾,以及大规模遥感数据存储与计算资源的优化配置,均为数据集构建的关键难题。
常用场景
经典使用场景
在野火预测研究领域,加利福尼亚野火清单通过整合气象、环境和地质等多维指标数据,为机器学习模型提供了丰富的训练素材。该数据集最经典的应用场景体现在构建时空人工智能模型,通过分析历史野火数据与实时传感器网络信息,能够提前两周预测大规模野火的发生概率。其独特的领先指标与滞后指标组合,使得研究人员能够深入探索野火形成的前兆规律与传播机制。
解决学术问题
该数据集有效解决了野火预测研究中数据维度单一、时空覆盖不足的核心难题。通过融合气象条件、空气质量参数和地形特征等37类指标,为学术界提供了探索多因素耦合作用对野火影响机制的研究基础。特别在解决传统方法难以捕捉的早期预警信号方面,数据集通过PM2.5浓度变化与露点温度等关键参数的时序分析,为构建高精度预测模型奠定了数据基石,显著推进了防灾减灾领域的学术进展。
实际应用
在实际防灾体系中,该数据集支撑的预测模型已成功应用于加州应急管理部门的风险评估系统。通过实时监测网络传输的传感器数据,系统能够生成动态火险等级地图,指导消防资源优化部署。在2018年野火季的实战检验中,基于该数据集的预测模型准确识别了85.7%的30万英亩以上大规模野火,为提前实施疏散计划和启动应急响应赢得了关键时间窗口。
数据集最近研究
最新研究方向
随着全球气候变化加剧野火风险,加利福尼亚野火清单(CAWFI)作为多模态预测数据库,正推动人工智能在生态安全领域的前沿探索。当前研究聚焦于融合气象、环境与地质指标,构建时空深度学习模型,以提前数周预测大规模野火。例如,基于该数据集训练的U-Convolutional-LSTM架构已实现85.7%的超30万英亩野火预测准确率,显著优于传统方法。这一进展与近年极端野火事件频发的社会关切相呼应,为区域防灾资源调配提供了数据驱动范式,同时为全球类似生态系统的风险预警研究树立了技术基准。
相关研究论文
  • 1
    通过斯坦福大学, 哈佛大学公共卫生学院, 德克萨斯大学健康科学中心 · 2025年
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务