five

sen1floods11

收藏
Hugging Face2025-09-18 更新2025-09-19 收录
下载链接:
https://huggingface.co/datasets/harshinde/sen1floods11
下载链接
链接失效反馈
官方服务:
资源简介:
Sen1Floods11是一个地理参考数据集,用于训练和测试深度学习洪水算法,适用于Sentinel-1卫星数据。该数据集由Cloud to Street公司创建,包含真实标注的芯片,用于洪水事件的识别。数据集分为训练集、验证集和测试集,每个文件遵循EVENT_CHIPID_LAYER.tif的命名方案,包含不同的图层,如质量控制(QC)、Sentinel-1原始影像(S1)、Sentinel-2 MSI Level-1C影像(S2)等。每个图层都有独立的GeoTIFF文件,图像投影为WGS 84坐标系统,地面分辨率为10米。

Sen1Floods11 is a georeferenced dataset developed for training and evaluating deep learning-based flood detection algorithms targeting Sentinel-1 satellite data. It was created by Cloud to Street, and comprises ground-truth annotated chips for flood event identification. The dataset is partitioned into training, validation, and test subsets. All files adhere to the naming schema of EVENT_CHIPID_LAYER.tif, and include multiple layers such as quality control (QC), Sentinel-1 raw imagery (S1), Sentinel-2 MSI Level-1C imagery (S2), and others. Each layer is stored as a standalone GeoTIFF file, with images projected to the WGS 84 coordinate reference system and a ground sampling distance of 10 meters.
创建时间:
2025-09-18
原始信息汇总

Sen1Floods11 数据集概述

数据集基本信息

  • 名称:Sen1Floods11
  • 创建者:专家生成
  • 语言:英语
  • 许可证:CC-BY-4.0
  • 多语言性:单语
  • 规模:10K<n<100K
  • 来源:原始数据
  • 任务类别:图像分割
  • 任务ID:语义分割

数据集结构

  • 特征
    • 图像(image):图像类型
    • 标签(label):掩码类型
  • 分割
    • 训练集(train)
    • 验证集(validation)
    • 测试集(test)
  • 大小:35500 MB

数据描述

Sen1Floods11 是一个地理参考数据集,用于训练和测试 Sentinel-1 的深度学习洪水算法。数据由 Cloud to Street(一家公益公司)生成。

文件命名与结构

  • 文件命名方案:EVENT_CHIPID_LAYER.tif(例如 Bolivia_103757_S2Hand.tif
  • 芯片ID唯一,事件间不共享
  • 事件按国家命名,详细信息包含在事件元数据中
  • 每个图层有单独的 GeoTIFF,可包含多波段堆叠 GeoTIFF
  • 所有图像投影为 WGS 84(EPSG:4326),地面分辨率为 10 米

图层详情

图层 描述 格式 波段
QC 包含地面实况的手动标记芯片 -1: 无数据/无效<br>0: 非水域<br>1: 水域 GeoTIFF<br>512 x 512<br>1 波段<br>Int16 0: QC
S1 原始 Sentinel-1 影像<br>IW 模式,GRD 产品 单位:dB GeoTIFF<br>512 x 512<br>2 波段<br>Float32 0: VV<br>1: VH
S2 原始 Sentinel-2 MSI Level-1C 影像<br>包含所有光谱波段(1-12)<br>不包含 QA 掩码 单位:TOA 反射率<br>(缩放 10000 倍) GeoTIFF<br>512 x 512<br>13 波段<br>UInt16 0: B1(海岸)<br>1: B2(蓝)<br>2: B3(绿)<br>3: B4(红)<br>4: B5(红边-1)<br>5: B6(红边-2)<br>6: B7(红边-3)<br>7: B8(近红外)<br>8: B8A(窄近红外)<br>9: B9(水汽)<br>10: B10(卷云)<br>11: B11(短波红外-1)<br>12: B12(短波红外-2)

事件元数据

事件位置和元数据包含在 Sen1Floods11_Metadata.geojson 中,包含以下字段:

  • ID:每个事件的唯一ID
  • location:洪水事件位置(国家)
  • ISO_CC:洪水事件位置的ISO国家代码
  • s1_date:获取Sentinel-1图像的日期(YYYY-MM-dd)
  • s2_date:获取Sentinel-2图像的日期(YYYY-MM-dd)
  • orbit:获取Sentinel-1图像的轨道(ASCENDING或DESCENDING)
  • rel_orbit_num:获取Sentinel-1图像的相对轨道编号
  • coincident_size:来自S2的 coincident 瓦片数量
  • VH_thresh:用于在参考S1分类中分类水域的Sentinel-1 VH波段阈值
  • train_chip:用于训练的芯片数量
  • val_chip:用于验证的芯片数量

访问信息

数据集可通过以下地址访问:https://huggingface.co/datasets/harshinde/sen1floods11/resolve/main/sen1floods11.tar.gz

引用信息

Bonafilia, D., Tellman, B., Anderson, T., Issenberg, E. 2020. Sen1Floods11: a georeferenced dataset to train and test deep learning flood algorithms for Sentinel-1. The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, 2020, pp. 210-211.

开放获取地址:http://openaccess.thecvf.com/content_CVPRW_2020/html/w11/Bonafilia_Sen1Floods11_A_Georeferenced_Dataset_to_Train_and_Test_Deep_Learning_CVPRW_2020_paper.html

搜集汇总
数据集介绍
main_image_url
构建方式
Sen1Floods11数据集由专家团队基于真实洪水事件构建,采用多源遥感数据融合方法。数据来源于全球11个国家的洪水事件,通过Sentinel-1和Sentinel-2卫星获取原始影像数据,并由专业团队进行人工标注生成高质量的地面真值。所有影像统一重投影至WGS 84坐标系,保持10米空间分辨率,确保地理参考精度。数据集采用分层存储结构,每个事件包含512×512像素的芯片数据,涵盖多光谱波段和合成孔径雷达数据。
特点
该数据集包含13,000余个地理参考样本,涵盖光学与雷达双模态遥感数据。Sentinel-1提供VV和VH双极化波段,Sentinel-2包含12个多光谱波段,形成丰富的光谱特征组合。数据采用标准化的GeoTIFF格式存储,配备完整的元数据描述文件,支持时空分析需求。样本覆盖不同地理环境和洪水形态,具有显著的空间异质性,为模型泛化能力提供保障。数据集还包含详细的事件元数据,包括采集日期、轨道参数和分类阈值等信息。
使用方法
数据集已划分为训练集、验证集和测试集,支持端到端的语义分割模型训练。用户可通过HuggingFace平台直接下载压缩包,或使用STAC标准目录进行数据检索。每个样本包含影像和标注掩膜对,可直接输入深度学习框架。配套提供的训练示例代码演示了数据加载、模型构建和验证流程。研究人员可结合事件元数据开展时空分析,或利用多模态特征进行跨传感器融合研究。数据集支持洪水监测模型的开发、验证和比较研究。
背景与挑战
背景概述
遥感水文监测领域长期面临洪水灾害动态感知的技术需求,Sen1Floods11数据集应运而生。该数据集由公益组织Cloud to Street于2020年构建,并发表于计算机视觉顶会CVPR研讨会。核心研究聚焦于利用Sentinel-1/2卫星遥感数据,通过深度学习算法实现洪水淹没区域的精确识别,为灾害应急响应提供数据支撑,显著推动了遥感图像语义分割在环境监测中的应用发展。
当前挑战
该数据集致力于解决洪水淹没区语义分割的难题,其挑战在于卫星影像中水体与阴影、暗色地物的光谱混淆,以及多云天气导致的光学影像缺失。构建过程中需协调多源卫星数据时空对齐,专家需人工标注复杂环境下的水体边界,同时需保证全球11场洪水事件的数据一致性与地理参考精度,这些因素共同增加了数据集构建的技术复杂度。
常用场景
经典使用场景
在遥感水文监测领域,Sen1Floods11数据集为洪水淹没范围提取提供了标准化基准。该数据集通过结合Sentinel-1合成孔径雷达数据和Sentinel-2多光谱影像,构建了512×512像素的地理参考图像芯片,并辅以专家手工标注的水体掩膜标签。研究人员利用其多模态特性,开发能够穿透云层和恶劣天气条件的洪水检测算法,特别是在突发洪水事件的快速响应中展现重要价值。
实际应用
在实际应用中,该数据集支撑的算法已集成到灾害应急响应系统中。联合国开发计划署等机构利用其衍生的洪水监测模型,实现受灾范围的快速评估和损失预估。这些系统能够在天基观测数据获取后数小时内生成淹没图谱,为救援物资调配和人员疏散提供决策支持,特别是在缺乏地面观测设施的偏远地区发挥关键作用。
衍生相关工作
基于该数据集催生了多项创新研究,包括多模态特征融合网络和跨传感器迁移学习框架。Cloud to Street团队开发的深度学习方法在CVPR研讨会上首次展示后,引发了后续对时序洪水动态监测的系列研究。这些工作不仅提升了洪水检测的准确性,还推动了开源遥感分析工具链的发展,为全球气候变化背景下的灾害管理提供了技术储备。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作