five

Kuro Siwo

收藏
arXiv2023-11-18 更新2024-06-21 收录
下载链接:
https://github.com/Orion-AI-Lab/KuroSiwo
下载链接
链接失效反馈
官方服务:
资源简介:
Kuro Siwo数据集是由奥利安实验室等机构精心策划的多时相SAR数据集,专注于全球洪水事件的快速映射。该数据集覆盖了32个全球洪水事件,总覆盖面积超过63亿平方米,其中12.1亿平方米为洪水或永久水体。数据集的特点在于其卓越的标注质量,旨在支持监督环境下的快速洪水映射。此外,数据集还包括一个大型未标注的SAR样本集,用于自监督预训练,以增强学习。Kuro Siwo数据集的应用领域广泛,旨在通过精确的洪水映射帮助应急响应、理解脆弱性并为未来事件做准备,从而在气候变化挑战中支持民事保护和人道主义机构。

The Kuro Siwo Dataset is a meticulously curated multi-temporal SAR dataset dedicated to rapid flood mapping of global flood events, developed by institutions including Orion Labs and other relevant organizations. It encompasses 32 global flood events, with a total coverage area exceeding 6.3 billion square meters, out of which 1.21 billion square meters are categorized as floodwater or permanent water bodies. The dataset stands out for its superior annotation quality, and is intended to support rapid flood mapping in supervised learning contexts. Furthermore, the dataset includes a large-scale unannotated SAR sample set for self-supervised pre-training to enhance model learning performance. The Kuro Siwo Dataset has a wide range of application scenarios, aiming to aid emergency response, assess vulnerability and prepare for future flood events through accurate flood mapping, thereby supporting civil protection and humanitarian agencies in addressing climate change challenges.
提供机构:
奥利安实验室,雅典国家天文台,雅典国立技术大学,哈洛基奥大学
创建时间:
2023-11-18
搜集汇总
数据集介绍
main_image_url
构建方式
Kuro Siwo 数据集的构建采用了 Sentinel-1A&B 卫星的多时相 SAR 图像,覆盖了 2015 年至 2021 年间全球 32 个洪水事件。该数据集包含了每个事件的三个 SAR 图像,包括两个事件前图像和一个事件后图像,图像分辨率为 10 米。图像数据经过预处理,包括精确轨道应用、去除热噪声和边界噪声、陆地和海洋掩膜、校准、斑点滤波和地形校正。数据集的标注由一组 SAR 专家通过人工光解释完成,标注类别包括永久水体、洪水和无水。此外,数据集还包含了一个大型未标注的 SAR 数据集,用于自监督预训练。
使用方法
Kuro Siwo 数据集可用于以下几种方法:1)监督学习:使用标注数据训练深度学习模型,进行洪水区域和永久水体检测;2)半监督学习:利用标注数据和未标注数据进行训练,提高模型的泛化能力;3)自监督预训练:使用未标注数据进行预训练,再进行下游任务训练。此外,数据集还提供了一个名为 BlackBench 的基准测试,包含多种强大的模型作为基线,可用于评估和比较不同模型的性能。
背景与挑战
背景概述
随着气候变化加剧,全球洪水频发,对人类生命、基础设施和环境构成严重威胁。为了应对这一挑战,精确的洪水测绘变得至关重要,它可以帮助指导恢复工作、了解脆弱性并应对未来事件。然而,尽管合成孔径雷达 (SAR) 提供了全天候成像能力,但由于缺乏大型注释数据集,其在深度学习中的应用受到限制。为了填补这一空白,研究人员创建了一个名为 Kuro Siwo 的全球多时相卫星数据集,涵盖了全球 32 次洪水事件,并对其进行了详细的标注。该数据集不仅包含了超过 630 亿平方米的土地测绘数据,还特别注重标注质量,以实现快速洪水测绘。此外,Kuro Siwo 还包含了一个大型未标记的 SAR 样本集,旨在促进自监督预训练。该数据集的发布为深度学习社区提供了一个宝贵的机会,可以开发出能够快速测绘洪水的解决方案,从而帮助民用保护和人道主义机构应对气候变化的挑战。
当前挑战
Kuro Siwo 数据集的构建过程中面临的主要挑战包括:1) SAR 图像中的斑点噪声问题,这导致了随机亮度变化,使得图像分割任务变得复杂;2) 深度学习方法需要大量精心策划的训练数据才能发挥其潜力,而现有的 SAR 数据集往往缺乏足够的标注数据;3) 永久性水体和洪水区域的区分问题,尤其是在河流和湖泊附近,由于水流不断变化,使得 SAR 图像中的水体特征难以准确识别。此外,SAR 数据中的斑点噪声和不同时间步长的图像对齐问题也对模型的性能提出了挑战。
常用场景
经典使用场景
Kuro Siwo 数据集作为全球多时相合成孔径雷达 (SAR) 数据集,其经典使用场景在于快速洪水映射。该数据集包含来自全球 32 次洪水事件的 SAR 影像,覆盖超过 630 亿平方米的土地,其中 121 亿平方米为洪水区域或永久水体。Kuro Siwo 数据集的独到之处在于其无与伦比的注释质量,这为在监督环境中进行快速洪水映射提供了便利。此外,Kuro Siwo 数据集还包括大量未标记的 SAR 样本,旨在进行自监督预训练,以增强学习效果。该数据集提供了广泛的基准测试和强大的基线,涵盖了来自欧洲、美洲、非洲和澳大利亚的各种洪水事件。
解决学术问题
Kuro Siwo 数据集解决了洪水映射中缺乏大型注释数据集的问题。合成孔径雷达 (SAR) 提供了全天候、全天候的成像能力,但由于缺乏大型注释数据集,其在深度学习中的应用受到了限制。Kuro Siwo 数据集通过精心策划的多时相数据,跨越 32 次全球洪水事件,填补了这一空白。该数据集包含时间序列 SAR 影像,双极化配对,以及高程信息,使其成为快速洪水映射的独特和极有价值的数据集。Kuro Siwo 数据集的发布推动了该领域的研究,为开发支持民事保护当局的实用工具提供了可能。
实际应用
Kuro Siwo 数据集的实际应用场景包括灾难响应和救济、基础设施保护、洪水风险评估、城市规划、土地使用分区、洪水缓解策略制定、保险公司和金融机构的洪水相关风险评估、以及适应不断变化的气候环境。准确的洪水地图对于有效地管理洪水灾害至关重要,它可以帮助紧急救援人员、人道主义组织和政府机构有效地分配资源、提供援助和支持受灾民众。此外,准确的洪水地图还可以帮助识别易受洪水损害的关键基础设施,并指导城市规划、土地使用分区和洪水缓解策略的制定。
数据集最近研究
最新研究方向
鉴于全球气候变化导致的洪水频发,Kuro Siwo 数据集的发布对于推动快速洪水测绘的研究具有重要意义。该数据集提供了32个全球洪水事件的SAR图像,并进行了人工标注,极大地提高了标注质量。此外,Kuro Siwo 还包含了一个大规模的无标签SAR数据集,用于探索半监督学习和大规模自监督学习。BlackBench 作为第一个在Kuro Siwo上进行的全面基准测试,为快速洪水测绘提供了强大的基线模型。未来研究可以进一步探索利用大规模自监督学习提高洪水测绘模型的泛化能力,并针对永久水体和洪水区域的区分进行优化。
相关研究论文
  • 1
    Kuro Siwo: 12.1 billion $m^2$ under the water. A global multi-temporal satellite dataset for rapid flood mapping奥利安实验室,雅典国家天文台,雅典国立技术大学,哈洛基奥大学 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作