five

ai-for-good-lab/ai4g-flood-dataset

收藏
Hugging Face2025-10-28 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/ai-for-good-lab/ai4g-flood-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
洪水检测数据集,包含卫星观测的洪水检测数据。数据集按地理区域划分为3°×3°的瓦片,每个瓦片包含Parquet格式的详细观测数据和时间戳、地点、环境指标,以及不同缓冲距离的GeoTIFF格式洪水范围图像。适用于洪水监测和研究。

Flood Detection Dataset containing satellite-based flood detection data. The dataset is divided into 3°×3° geographic tiles, each with detailed Parquet observation data including timestamps, locations, and environmental metrics, as well as GeoTIFF images of flood extent at different buffer distances. Suitable for flood monitoring and research.
提供机构:
ai-for-good-lab
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于Sentinel-1合成孔径雷达(SAR)影像,利用深度学习变化检测模型构建,覆盖2014年10月至2024年9月的十年全球洪水事件。数据以3°×3°的瓦片形式组织,每个瓦片包含Parquet格式的观测记录及80米和240米缓冲区的GeoTIFF产品,并辅以土壤湿度、高程、温度和土地覆盖等环境指标用于误报过滤。洪水复现图则统计了各像素点出现洪水的月份数,提供了时空维度的累积观测信息。
使用方法
使用该数据集时,针对单次洪水事件可直接加载未过滤的Parquet数据进行分析;若需聚合多个月份的数据,则推荐应用预设过滤条件(如排除陡峭地形、低土壤湿度和裸地等)。生成栅格输出时,建议对检测点施加80米缓冲区(4像素)以提升精度。所有数据可通过HuggingFace页面下载,并配合公开的GitHub代码库进行模型复现或自定义处理,最终输出GeoTIFF格式的洪水分布图。
背景与挑战
背景概述
全球洪水灾害频发,对生命财产和生态系统构成严重威胁,而传统光学遥感受云层覆盖限制,难以实现全天候、高时空分辨率的洪水监测。为此,由微软研究院主导、联合多国科研机构于2025年发布的ai4g-flood数据集,基于Sentinel-1合成孔径雷达(SAR)影像与深度学习变化检测模型,构建了覆盖2014年至2024年十年间全球洪水事件的高精度(20米)探测成果。该数据集以3°×3°图幅组织,提供逐像素的洪水检测结果及辅助环境变量(如土壤湿度、地形、温度),为全球洪水时空动态分析、灾害风险评估及气候变化研究提供了前所未有的基准数据,显著推动了遥感与人工智能在灾害科学中的交叉应用。
当前挑战
该数据集面临的核心挑战包括:其一,在复杂地形(如陡坡、城市建成区)和密集植被覆盖区域,SAR后向散射信号易受干扰,导致洪水检测的误报与漏报问题突出,需依赖辅助数据(如数字高程模型、土地覆盖分类)进行多阈值联合过滤;其二,构建过程中需处理海量时序SAR影像的配准、辐射校正及变化检测算法优化,同时应对干旱裸地、冰雪边缘等噪声源导致的伪变化信号;其三,全球尺度的数据存储与标准化归档面临挑战,需平衡空间分辨率(20米)与计算效率,并通过80米和240米缓冲区产品降低边缘效应,确保产品在不同地理环境下的泛化能力与可靠性。
常用场景
经典使用场景
该数据集的核心使用场景在于利用十年间(2014—2024年)的Sentinel-1合成孔径雷达(SAR)影像,通过深度学习变化检测模型生成全球尺度、20米高分辨率的洪水淹没图。研究者可针对特定洪水事件加载未经滤波的Parquet数据,进行单次事件分析,亦可结合辅助环境变量(如土壤湿度、地形坡度、温度与土地覆盖类型)实施后处理滤波,以降低误检率。此外,提供80米与240米缓冲区的GeoTIFF产品,便于生成高精度的洪水范围栅格图,从而支持长时序聚合分析与洪水复发频率制图。
解决学术问题
该数据集解决了全球洪水监测中长期存在的多云天气下光学遥感受限与历史观测一致性不足的学术难题。通过利用SAR信号穿透云层与夜间成像的能力,结合十年连续观测,为气候变暖背景下洪水时空演变规律研究提供了可靠的基础数据。同时,针对复杂地形与干旱区易产生误检的问题,数据集内置了基于多源辅助数据的滤波策略,显著提升了洪水检测的准确性,从而支撑了全球洪水风险区划、灾害归因分析以及气候变化对极端水文事件影响机制等前沿科学问题的探索。
实际应用
在实际应用中,该数据集可服务于多类防灾减灾决策场景。应急管理部门可借助单事件分析功能,快速获取洪涝灾害的淹没范围与受影响区域,为灾情评估与救援资源调度提供即时空间信息。水利与国土规划部门可利用长时序洪水复发图,识别高频率洪泛区,辅助防洪工程选址与土地利用规划。此外,农业与生态领域可结合土地覆盖数据,评估洪涝对耕地与自然植被的周期性影响,从而优化作物布局与生态修复策略。
数据集最近研究
最新研究方向
基于十年哨兵一号合成孔径雷达影像与深度学习变化检测模型的全球洪水动态制图研究。该数据集以20米高分辨率、穿透云层的雷达成像优势,突破了传统光学遥感在洪水监测中的时空局限,首次构建了2014至2024年全球尺度洪水事件的长时序档案。其创新性地融合土壤湿度、地形坡度、地表温度等多维辅助数据构建假阳性过滤机制,显著提升了洪水边界提取的可靠性。当前前沿方向聚焦于利用该数据集对极端气候事件(如2022年巴基斯坦超级洪水和2023年利比亚大坝溃决)进行快速灾情评估,结合80米缓冲区的空间优化策略,为应急响应和灾后重建提供高精度决策支持。此外,洪水复发频率图谱的生成推动了脆弱性区域识别与气候适应性规划研究,标志着星载雷达遥感在全球水灾风险量化领域迈入实用化阶段。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作