sKwanda_V2: OpenGeoAI-Dataset
收藏sKwanda_V2: OpenGeoAI-Dataset | Optical Imagery Training Set
数据集概述
sKwanda_V2: OpenGeoAI-Dataset 是一个高分辨率光学影像数据集,旨在支持地理空间机器学习应用的高级研究,如语义分割、土地覆盖分类和空间分析。该数据集提供从航空遥感数据中提取的地理空间参考图像块。图像分为训练、验证和测试三个子集,每个子集包含512 × 512像素的图像块及其对应的地面真值(GT)标签。该数据集特别适用于监督学习任务,支持开发和评估地理空间AI领域的尖端模型。
关键特性
- 高分辨率影像:数据集包含512 × 512像素的图像块,适用于土地覆盖和空间特征的细粒度分析。
- 地理空间参考:所有图像均使用NAD83 / UTM Zone 18N坐标系(EPSG: 26918)进行地理配准,确保任务所需的精确映射和基于位置的分析。
- 光谱波段:数据集包括多个光谱波段,为多光谱分类和植被分析等高级遥感应用提供有价值的信息。
- 地面真值标签:每个图像块都配有相应的地面真值标签,定义土地覆盖类别(如水、植被、城市等),用于监督分类任务。
- 开源:数据集公开提供,供非商业研究使用,有助于推动地理空间AI在社会公益和环境监测方面的发展。
数据集结构
数据集分为三个子集:
- 训练集:用于训练机器学习模型的图像。包含多样化的图像块和标签。
- 验证集:用于调整模型超参数和验证模型开发阶段的性能。
- 测试集:用于评估训练模型的最终性能,提供对未见数据的公正评估。
每个图像块为512 × 512像素,数据集包含多个光谱波段,通常包括红、绿、蓝和近红外(NIR)波段。
地理空间元数据
.aux文件包含详细的坐标系统、地理变换和图像波段信息。关键元素包括:
- 坐标系统(PROJCS):使用NAD83 / UTM Zone 18N(EPSG: 26918)进行地理配准,确保与地理空间软件兼容并实现精确映射。
- 地理变换(GeoTransform):定义像素坐标如何映射到真实世界坐标,确保从大图像中提取的图块保持空间完整性。
- 光谱波段:每个图像包含四个波段,包括红、绿、蓝和近红外(NIR)。元数据确保每个波段的NoData值和源索引正确记录。
数据集获取位置
sKwanda_V2数据集在Nyagatare和Rwamagana(左上角为红色A)以及National Agriculture Imagery Program(左上角为红色B)和CheasaBay土地覆盖产品上获取。
使用
安装
通过Google Drive下载数据集(链接在仓库中提供)。
预处理和图块提取
- 图块提取:将大型航空图像分割成较小的512 × 512像素图块。此过程确保数据易于管理和准备用于训练深度学习模型。
- 地理空间完整性:分割图像时,保留GeoTIFF元数据,包括地理变换和投影系统信息,确保每个提取的图块保持其空间参考。
模型训练
该数据集适用于监督学习任务,特别是在土地覆盖分类和语义分割的背景下。研究人员可以使用此数据集训练深度学习模型,确保模型学习空间模式和全局特征。
评估
使用测试集评估训练模型的性能,使用准确率、IoU(交并比)和F1分数等指标评估模型效能。
许可证和引用
许可证:数据集在非商业许可证下发布,仅供学术和研究使用。如需商业使用,请联系作者。
引用
bibtex @article{Mwubahimana2024sKwanda, title={sKwanda V2: OpenGeoAI Dataset for Optical Imagery Training}, author={Boaz Mwubahimana}, year={2024}, journal={IEEE Journal of Geospatial AI}, volume={XX}, number={YY}, pages={ZZ-ZZ},
致谢
该数据集的创建得到了武汉大学信息工程测量、制图和遥感国家重点实验室行星科学小组的支持。特别感谢Google Earth、L2HNet、Sentinel Hub和ESRI提供的工具和资源。
联系信息
如有任何疑问或合作机会,请联系Boaz Mwubahimana,邮箱:aiboaz1896@gmail.com。




