csaybar/CloudSEN12-high|云语义理解数据集|遥感数据数据集
收藏hugging_face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/csaybar/CloudSEN12-high
下载链接
链接失效反馈资源简介:
CloudSEN12是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含来自Sentinel-2的1C和2A级别的数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,提供高质量、涂鸦和无注释三种手工标注数据。数据集还详细描述了文件的类型、波长、比例和数据类型,并提供了数据集的训练、验证和测试集的划分比例。
CloudSEN12是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含来自Sentinel-2的1C和2A级别的数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,提供高质量、涂鸦和无注释三种手工标注数据。数据集还详细描述了文件的类型、波长、比例和数据类型,并提供了数据集的训练、验证和测试集的划分比例。
提供机构:
csaybar
原始信息汇总
数据集概述:CloudSEN12 HIGH-QUALITY
数据集基本信息
- 名称:CloudSEN12 HIGH-QUALITY
- 类型:大型数据集,约1 TB
- 目的:用于云语义理解
- 包含内容:49,400个图像块(IP),每个IP覆盖5090 x 5090米,包含Sentinel-2 1C和2A级数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水发生、土地覆盖类别、六种尖端云检测算法的云掩码结果。
数据集特点
- 支持的学习策略:适用于弱监督、自监督/半监督学习
- 标注数据形式:包含三种手工标注数据形式:高质量、涂鸦和无标注
数据集内容详细描述
文件及数据类型
| 文件 | 名称 | 比例 | 波长 | 描述 | 数据类型 |
|---|---|---|---|---|---|
| L1C_ & L2A_ | B1至B12 | 0.0001 | 不同波长 | 不同波段的光谱信息,如Aerosols、Blue、Green、Red等 | np.int16 |
| L1C_ | B10 | 0.0001 | 1373.5nm | Cirrus | np.int16 |
| L2A_ | AOT, WVP, TCI_R, TCI_G, TCI_B | 不同比例 | - | Aerosol Optical Thickness, Water Vapor Pressure, True Color Image的红、绿、蓝 | np.int16 |
| S1_ | VV, VH, angle | 1 | 5.405GHz | 合成孔径雷达数据,如双频交叉极化、单频同极化等 | np.float32 |
| EXTRA_ | CDI, Shwdirection, elevation, ocurrence, LC100, LC10 | 不同比例 | - | 云位移指数、方位角、海拔、地表水发生频率、土地覆盖类别等 | np.int16 |
| LABEL_ | fmask, QA60, s2cloudless, sen2cor, cd_fcnn_rgbi, cd_fcnn_rgbi_swir, kappamask_L1C, kappamask_L2A, manual_hq, manual_sc | 1 | - | 不同云检测算法的结果和手工标注数据 | 不同数据类型 |
标注描述
| CloudSEN12 | KappaMask | Sen2Cor | Fmask | s2cloudless | CD-FCNN | QA60 |
|---|---|---|---|---|---|---|
| 0 Clear | 1 Clear | 4 Vegetation | 0 Clear land | 0 Clear | 0 Clear | 0 Clear |
| 1 Thick cloud | 4 Cloud | 8 Cloud medium probability | 4 Cloud | 1 Cloud | 1 Cloud | 1024 Opaque cloud |
| 2 Thin cloud | 3 Semi-transparent cloud | 10 Thin cirrus | 2 Cloud shadow | - | - | 2048 Cirrus cloud |
| 3 Cloud shadow | 2 Cloud shadow | 3 Cloud shadows | - | - | - | - |
数据集使用
- 下载链接:CloudSEN12
- 数据集分割:训练集占84.90%,验证集占5.35%,测试集占9.75%
- 数据处理:图像为512 x 512像素,实际数据从像素(1,1)到(509,509),周围有3像素的填充。
