five

UrbanSARFloods

收藏
arXiv2024-06-06 更新2024-06-21 收录
下载链接:
https://github.com/jie666-6/UrbanSARFloods
下载链接
链接失效反馈
官方服务:
资源简介:
UrbanSARFloods是一个专为城市和开放区域洪水映射设计的基准数据集,由慕尼黑工业大学开发。该数据集包含8,879个512×512像素的芯片,覆盖807,500平方公里,跨越5大洲和20种土地覆盖类型,涉及18次洪水事件。数据集内容包括洪水前后的Sentinel-1强度数据和干涉相干图像,采用VV和VH极化方式获取。创建过程中,数据集通过半自动标注和手动标注相结合的方式进行标注,以确保数据的准确性和可靠性。该数据集主要应用于大规模城市洪水映射,旨在解决现有数据集在城市洪水映射方面的不足,推动深度学习技术在洪水监测领域的应用。

UrbanSARFloods is a benchmark dataset developed by Technische Universität München for urban and open-area flood mapping. It consists of 8,879 512×512 pixel image chips, covering a total area of 807,500 square kilometers, spanning 5 continents, encompassing 20 land cover types, and involving 18 flood events. The dataset includes Sentinel-1 intensity data and interferometric coherence images acquired before and after floods using VV and VH polarizations. To ensure data accuracy and reliability, a combination of semi-automatic and manual annotation methods was employed during dataset creation. This dataset is primarily applied to large-scale urban flood mapping, with the objective of addressing the shortcomings of existing datasets in urban flood mapping and advancing the application of deep learning technologies in the field of flood monitoring.
提供机构:
慕尼黑工业大学航空航天与大地测量系,地球观测数据科学
创建时间:
2024-06-06
搜集汇总
数据集介绍
main_image_url
构建方式
在合成孔径雷达(SAR)遥感领域,针对大尺度洪水监测中城市区域数据匮乏的现状,UrbanSARFloods数据集通过系统化流程构建而成。该数据集基于哨兵一号(Sentinel-1)单视复数(SLC)数据,覆盖全球五大洲的18次洪水事件,空间范围达807,500平方公里。数据预处理包括对SAR强度影像进行辐射定标与地理编码,并利用干涉处理生成干涉相干性影像,最终形成包含事件前、事件期间共8个波段(VV与VH极化的强度与相干性)的影像芯片。标签生成采用半自动与人工标注结合的方式:通过分层分割变化检测方法提取开放水域洪水,结合世界聚落足迹数据与相干性差异阈值识别城市洪水;同时,针对部分区域辅以高分辨率光学影像进行人工精细标注,确保了标签的可靠性与多尺度适用性。
特点
UrbanSARFloods的突出特点在于其面向大尺度洪水制图的双重类别体系与多模态数据融合。数据集明确区分了开放区域洪水与城市区域洪水两类目标,涵盖了20种土地覆盖类型,有效弥补了现有洪水数据集偏重开放水域而忽视城市环境的不足。数据维度上,它不仅提供多时相的SAR强度信息,还纳入了干涉相干性这一关键特征,后者对于识别部分淹没的建筑体具有重要指示作用。此外,数据集在样本划分上采用了基于洪水事件与类别平衡的分层抽样策略,包含了8,879个512×512像素的非重叠芯片,并提供了标准的训练、验证与测试子集划分,为模型评估与比较建立了可靠基准。
使用方法
该数据集主要用于支持基于深度学习的SAR大尺度洪水制图算法开发与性能评估。研究者可利用其提供的多波段SAR强度与相干性影像芯片及对应标签,训练语义分割模型以同时检测开放区域与城市区域的洪水。数据已按事件与类别分层划分为训练集、验证集和测试集,其中测试集包含来自不同大洲、具备高分辨率光学验证数据的洪水事件,便于评估模型的泛化能力。典型工作流程包括加载预处理后的影像与标签,构建卷积神经网络模型进行端到端训练,并采用精确率、召回率与F1分数等指标对洪水类别进行定量分析。数据集的官方划分确保了实验的可复现性,为探索数据不平衡、小样本学习及跨域迁移等挑战提供了标准化的实验平台。
背景与挑战
背景概述
合成孔径雷达(SAR)凭借其穿透云层及不受光照条件限制的独特优势,已成为大尺度洪水制图领域的关键数据源。然而,现有基于深度学习的SAR洪水制图研究多聚焦于开阔水域,对城市洪涝的探测能力尚存局限。为填补这一空白,慕尼黑工业大学Jie Zhao、Zhitong Xiong与Xiao Xiang Zhu等人于2024年正式发布了UrbanSARFloods数据集。该数据集以Sentinel-1单视复数数据为基础,整合了洪水事件前后的强度与干涉相干性影像,覆盖全球五大洲18次洪涝事件,包含8,879个512×512像素样本,空间范围达807,500平方公里,涉及20种土地覆盖类型。其核心目标在于构建一个兼顾城市与开阔区域洪涝的基准数据集,推动SAR数据在大尺度城市洪涝制图中的算法创新与应用拓展。
当前挑战
UrbanSARFloods致力于解决大尺度SAR洪涝制图中城市与开阔区域洪水的精准分割问题,其核心挑战体现在算法与数据两个层面。在算法层面,现有卷积神经网络模型面临严重的类别不平衡问题,洪水像素尤其是城市洪水像素在场景中占比极低,导致模型对洪水特征的识别能力不足;同时,基于ImageNet的预训练模型因光学影像与SAR数据在特征空间的显著差异,迁移学习效果有限,难以有效提取洪水的判别性特征。在数据构建层面,由于Sentinel-1影像空间分辨率相对较低,且城市区域洪水的雷达后向散射机制复杂,区分洪水与类似特征地物(如无植被裸土、风扰水面等)的标注工作极具挑战;此外,全球尺度洪水事件样本的收集、预处理与高质量标注需要耗费大量计算与人工成本,如何保证标注的一致性与地理代表性亦是关键难题。
常用场景
经典使用场景
在遥感与灾害监测领域,UrbanSARFloods数据集为基于合成孔径雷达(SAR)的大规模洪水制图研究提供了关键基准。该数据集整合了Sentinel-1强度数据与干涉相干性影像,覆盖全球五大洲的18次洪水事件,包含8,879个512×512像素的影像块,特别强调了城市与开阔区域洪水的双重标注。其经典应用场景在于为深度学习模型提供标准化训练与测试平台,支持语义分割算法在复杂地表覆盖条件下的性能评估与优化,尤其针对城市洪水检测这一长期存在的技术难点。
解决学术问题
UrbanSARFloods数据集有效应对了SAR洪水制图研究中城市洪水检测不足的学术空白。传统研究多集中于开阔水域,而该数据集通过融合强度与相干性多波段信息,并涵盖多样化的土地覆盖类型,为模型泛化能力提供了坚实基础。它显著解决了数据不平衡与小样本训练带来的挑战,推动了针对城市洪水特异性特征(如建筑双重反射与相干性骤降)的算法创新,为大规模洪水制图的可靠性与精度提升奠定了数据支撑。
衍生相关工作
围绕UrbanSARFloods数据集,已衍生出一系列重要的学术探索与技术改进。研究者在U-Net、DeepLabV3+等经典语义分割架构基础上,针对SAR数据特性与类别不平衡问题,提出了多种改进损失函数与训练策略。同时,该数据集促进了跨域迁移学习、自监督学习以及多模态数据融合等方法在洪水制图中的尝试,为SAR遥感与人工智能的交叉研究提供了丰富的实验平台与创新方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作