five

csaybar/CloudSEN12-high|云语义理解数据集|遥感数据数据集

收藏
hugging_face2023-10-04 更新2024-03-04 收录
云语义理解
遥感数据
下载链接:
https://hf-mirror.com/datasets/csaybar/CloudSEN12-high
下载链接
链接失效反馈
资源简介:
CloudSEN12是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含来自Sentinel-2的1C和2A级别的数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,提供高质量、涂鸦和无注释三种手工标注数据。数据集还详细描述了文件的类型、波长、比例和数据类型,并提供了数据集的训练、验证和测试集的划分比例。

CloudSEN12是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含来自Sentinel-2的1C和2A级别的数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,提供高质量、涂鸦和无注释三种手工标注数据。数据集还详细描述了文件的类型、波长、比例和数据类型,并提供了数据集的训练、验证和测试集的划分比例。
提供机构:
csaybar
原始信息汇总

数据集概述:CloudSEN12 HIGH-QUALITY

数据集基本信息

  • 名称:CloudSEN12 HIGH-QUALITY
  • 类型:大型数据集,约1 TB
  • 目的:用于云语义理解
  • 包含内容:49,400个图像块(IP),每个IP覆盖5090 x 5090米,包含Sentinel-2 1C和2A级数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水发生、土地覆盖类别、六种尖端云检测算法的云掩码结果。

数据集特点

  • 支持的学习策略:适用于弱监督、自监督/半监督学习
  • 标注数据形式:包含三种手工标注数据形式:高质量、涂鸦和无标注

数据集内容详细描述

文件及数据类型

文件 名称 比例 波长 描述 数据类型
L1C_ & L2A_ B1至B12 0.0001 不同波长 不同波段的光谱信息,如Aerosols、Blue、Green、Red等 np.int16
L1C_ B10 0.0001 1373.5nm Cirrus np.int16
L2A_ AOT, WVP, TCI_R, TCI_G, TCI_B 不同比例 - Aerosol Optical Thickness, Water Vapor Pressure, True Color Image的红、绿、蓝 np.int16
S1_ VV, VH, angle 1 5.405GHz 合成孔径雷达数据,如双频交叉极化、单频同极化等 np.float32
EXTRA_ CDI, Shwdirection, elevation, ocurrence, LC100, LC10 不同比例 - 云位移指数、方位角、海拔、地表水发生频率、土地覆盖类别等 np.int16
LABEL_ fmask, QA60, s2cloudless, sen2cor, cd_fcnn_rgbi, cd_fcnn_rgbi_swir, kappamask_L1C, kappamask_L2A, manual_hq, manual_sc 1 - 不同云检测算法的结果和手工标注数据 不同数据类型

标注描述

CloudSEN12 KappaMask Sen2Cor Fmask s2cloudless CD-FCNN QA60
0 Clear 1 Clear 4 Vegetation 0 Clear land 0 Clear 0 Clear 0 Clear
1 Thick cloud 4 Cloud 8 Cloud medium probability 4 Cloud 1 Cloud 1 Cloud 1024 Opaque cloud
2 Thin cloud 3 Semi-transparent cloud 10 Thin cirrus 2 Cloud shadow - - 2048 Cirrus cloud
3 Cloud shadow 2 Cloud shadow 3 Cloud shadows - - - -

数据集使用

  • 下载链接CloudSEN12
  • 数据集分割:训练集占84.90%,验证集占5.35%,测试集占9.75%
  • 数据处理:图像为512 x 512像素,实际数据从像素(1,1)到(509,509),周围有3像素的填充。
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集