S2WC-RSS-like
收藏S2WC-RSS-like 数据集概述
基本信息
- 许可证: CC-BY-4.0
- 任务类别: 特征提取
- 标签: 代码、遥感、弱监督语义分割
- 数据规模: 100K < n < 1M
数据来源
基于ESA WorldCover 2020 v100数据集:
- 引用: Zanaga, D., 等. (2021). ESA WorldCover 10 m 2020 v100. https://doi.org/10.5281/zenodo.5571936
- 主页: https://esa-worldcover.org/en
数据集结构
- 数据量: 约500,000个(图像、标签、类别比例)三元组
- 图像: 遥感复合图像,包含B4、B3、B2、B8、B11、B12、S1VV、S1VH波段,分辨率为10m,尺寸为128x128像素
- 标签: WorldCover 2020 V100语义分割图,包含11个类别
- 类别比例: 每个类别的像素占比(总和为1)
数据划分
- 训练集: 70%
- 验证集: 10%
- 测试集: 20%
- 额外信息: LMDB中包含每个划分的均值和标准差
使用说明
依赖项
- PyTorch
- LMDB
- NumPy
- SafeTensors
数据提取
bash tar -xz S2WC-RSS-like.tar.gz .
初始化数据集读取器
python import ./WCv1LMDBReader.py
初始化训练集
train_ds = WCv1LMDBReader(<path_to_lmdb_file>, split=train, output_bands=[Bands.ALL])
初始化验证集
val_ds = WCv1LMDBReader(<path_to_lmdb_file>, split=val, output_bands=[Bands.ALL])
初始化测试集
test_ds = WCv1LMDBReader(<path_to_lmdb_file>, split=test, output_bands=[Bands.ALL])
加载均值和标准差
train_mean, train_std = train_ds.get_mean_std() val_mean, val_std = val_ds.get_mean_std() test_mean, test_std = test_ds.get_mean_std()
创建PyTorch数据加载器
python from torch.utils.data import Dataloader
train_loader = utils.data.DataLoader(train_ds, batch_size=64, num_workers=4, shuffle=True) val_loader = utils.data.DataLoader(val_ds, batch_size=64, num_workers=4) test_loader = utils.data.DataLoader(test_ds, batch_size=64, num_workers=4)




