MITCriticalData/cloud2cloudless_dataset_5_municipalities
收藏Hugging Face2023-11-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MITCriticalData/cloud2cloudless_dataset_5_municipalities
下载链接
链接失效反馈官方服务:
资源简介:
Cloud-Cloudless Paired Dataset是基于哥伦比亚五个城市的卫星图像创建的。每个城市包含165张图像,这些图像通过satellite_extractor API从SentinelHub获取,覆盖12个不同的通道。数据集的核心目标是通过从每个城市的165张图像中减去最佳无云图像,生成164张图像,并将每张图像与无云图像配对,最终生成1640张图像或820对图像。数据集创建过程中使用了`Cloud2CloudlesDataset`类,并对图像进行了重命名和组织。
Cloud-Cloudless Paired Dataset是基于哥伦比亚五个城市的卫星图像创建的。每个城市包含165张图像,这些图像通过satellite_extractor API从SentinelHub获取,覆盖12个不同的通道。数据集的核心目标是通过从每个城市的165张图像中减去最佳无云图像,生成164张图像,并将每张图像与无云图像配对,最终生成1640张图像或820对图像。数据集创建过程中使用了`Cloud2CloudlesDataset`类,并对图像进行了重命名和组织。
提供机构:
MITCriticalData
原始信息汇总
创建云-无云配对数据集
数据集概述
- 来源: 使用包含哥伦比亚五个自治市的现有数据集。
- 结构: 每个自治市包含165张图像,通过satellite_extractor API和基于SentinelHub的12个不同通道获取。
- 处理: 每个自治市中精心挑选出最佳的无云图像,并将其名称存储在名为
cloudless_groundtruths的字典中。
数据集生成过程
- 目标: 从每个自治市的165张图像中减去特定的无云图像,得到164张图像,并与之前挑选的无云图像配对。
- 结果: 每个自治市生成164对图像,总共生成1640张图像或820对图像。
- 类: 引入
Cloud2CloudlesDataset类,复制每个自治市的164张图像的对应地面实况,并将每对图像存储在新建的DATASET文件夹中。
图像命名
- 原始格式:
image_DD%%MM%%YY - 新格式: 地面实况图像命名为
image_DD%%MM%%YY_gt,有云图像命名为image_DD%%MM%%YY_cloud。
初始化要求
- 输入路径: 包含每个自治市原始图像的源数据集路径。
- 输出路径: 新数据集存储的最终路径。
实现细节
- 测试: 验证图像数量,确保最终数量与源文件夹路径中的图像总数一致。
- 功能: 确保指定目标路径中每个文件夹的存在,保证数据集的组织性和完整性。



