five

csaybar/CloudSEN12-scribble|云语义理解数据集|遥感数据分析数据集

收藏
hugging_face2023-04-24 更新2024-03-04 收录
云语义理解
遥感数据分析
下载链接:
https://hf-mirror.com/datasets/csaybar/CloudSEN12-scribble
下载链接
链接失效反馈
资源简介:
CloudSEN12 SCRIBBLE是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含Sentinel-2的1C和2A级别数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,包含高质量、涂鸦和无注释三种手工标注数据。

CloudSEN12 SCRIBBLE是一个用于云语义理解的大规模数据集,包含49,400个图像块,覆盖除南极洲外的所有大陆。每个图像块覆盖5090 x 5090米,包含Sentinel-2的1C和2A级别数据、手工标注的厚云和薄云及云阴影、Sentinel-1合成孔径雷达(SAR)、数字高程模型、地表水出现频率、土地覆盖类别以及六种先进云检测算法的云掩码结果。数据集支持弱监督、自监督和半监督学习策略,包含高质量、涂鸦和无注释三种手工标注数据。
提供机构:
csaybar
原始信息汇总

数据集概述

数据集名称

CloudSEN12 SCRIBBLE

数据集描述

CloudSEN12是一个大型数据集(约1TB),专为云的语义理解设计。该数据集包含49,400个图像块(IP),均匀分布在全球除南极洲外的所有大陆。每个IP覆盖5090 x 5090米,包含来自Sentinel-2级别1C和2A的数据,以及手工标注的厚云、薄云和云影,Sentinel-1合成孔径雷达(SAR),数字高程模型,地表水出现情况,土地覆盖类别,以及六种尖端云检测算法的云掩码结果。

数据集内容

  • 图像数据:来自Sentinel-2的多个波段数据,包括可见光、近红外和短波红外波段。
  • 标注数据:包括高质星、涂鸦和无标注三种形式的手工标注数据。
  • 其他数据:包括Sentinel-1 SAR数据、数字高程模型、地表水出现频率、土地覆盖类别等。

文件描述

  • L1C_ & L2A_:Sentinel-2的多个波段数据,如B1至B12,涵盖不同的光谱范围。
  • S1_:Sentinel-1 SAR数据,包括VV和VH极化数据。
  • EXTRA_:额外数据,如云位移指数、方位角、海拔等。
  • LABEL_:多种云检测算法的标注结果,如fmask、QA60、s2cloudless等。

标注描述

  • CloudSEN12:提供0(清晰)、1(厚云)、2(薄云)、3(云影)的标注。
  • 其他算法:如KappaMask、Sen2Cor、Fmask等,各有其特定的标注值。

数据集形状

  • 训练集:(8785, 512, 512)
  • 验证集:(560, 512, 512)
  • 测试集:(655, 512, 512)

许可证

CC-BY-NC-4.0

用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

HUSTgearbox

This reposotory release a gearbox failure dataset, which can support intelliegnt fault diagnosis research

github 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录