five

MITCriticalData/cloud2cloudless_dataset_5_municipalities

收藏
Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MITCriticalData/cloud2cloudless_dataset_5_municipalities
下载链接
链接失效反馈
官方服务:
资源简介:
Cloud-Cloudless Paired Dataset是基于哥伦比亚五个城市的卫星图像创建的。每个城市包含165张图像,这些图像通过satellite_extractor API从SentinelHub获取,覆盖12个不同的通道。数据集的核心目标是通过从每个城市的165张图像中减去最佳无云图像,生成164张图像,并将每张图像与无云图像配对,最终生成1640张图像或820对图像。数据集创建过程中使用了`Cloud2CloudlesDataset`类,并对图像进行了重命名和组织。

Cloud-Cloudless Paired Dataset是基于哥伦比亚五个城市的卫星图像创建的。每个城市包含165张图像,这些图像通过satellite_extractor API从SentinelHub获取,覆盖12个不同的通道。数据集的核心目标是通过从每个城市的165张图像中减去最佳无云图像,生成164张图像,并将每张图像与无云图像配对,最终生成1640张图像或820对图像。数据集创建过程中使用了`Cloud2CloudlesDataset`类,并对图像进行了重命名和组织。
提供机构:
MITCriticalData
原始信息汇总

创建云-无云配对数据集

数据集概述

  • 来源: 使用包含哥伦比亚五个自治市的现有数据集。
  • 结构: 每个自治市包含165张图像,通过satellite_extractor API和基于SentinelHub的12个不同通道获取。
  • 处理: 每个自治市中精心挑选出最佳的无云图像,并将其名称存储在名为cloudless_groundtruths的字典中。

数据集生成过程

  • 目标: 从每个自治市的165张图像中减去特定的无云图像,得到164张图像,并与之前挑选的无云图像配对。
  • 结果: 每个自治市生成164对图像,总共生成1640张图像或820对图像。
  • : 引入Cloud2CloudlesDataset类,复制每个自治市的164张图像的对应地面实况,并将每对图像存储在新建的DATASET文件夹中。

图像命名

  • 原始格式: image_DD%%MM%%YY
  • 新格式: 地面实况图像命名为image_DD%%MM%%YY_gt,有云图像命名为image_DD%%MM%%YY_cloud

初始化要求

  • 输入路径: 包含每个自治市原始图像的源数据集路径。
  • 输出路径: 新数据集存储的最终路径。

实现细节

  • 测试: 验证图像数量,确保最终数量与源文件夹路径中的图像总数一致。
  • 功能: 确保指定目标路径中每个文件夹的存在,保证数据集的组织性和完整性。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作