five

sKwanda_V2: OpenGeoAI-Dataset

收藏
github2024-11-12 更新2024-11-23 收录
下载链接:
https://github.com/BoazGithub/sKwanda_V2-OpenGeoAI-Dataset-Optical-Imagery-Training-Set-Oklahoma-Louisiana-
下载链接
链接失效反馈
官方服务:
资源简介:
sKwanda_V2: OpenGeoAI-Dataset是一个高分辨率光学影像数据集,旨在支持地理空间机器学习应用的高级研究,如语义分割、土地覆盖分类和空间分析。该数据集提供了从航空遥感数据中提取的地理空间参考图像块。图像被组织成三个子集——训练、验证和测试——每个子集包含512 × 512像素的图像块及其相应的地面真值标签。该数据集特别为监督学习任务设计,支持在地理空间AI领域开发和评估前沿模型。

sKwanda_V2: OpenGeoAI-Dataset is a high-resolution optical imagery dataset intended to support advanced research on geospatial machine learning applications such as semantic segmentation, land cover classification and spatial analysis. This dataset provides geospatially referenced image patches extracted from aerial remote sensing data. The images are organized into three subsets: training, validation and test, each of which contains 512 × 512 pixel image patches and their corresponding ground truth labels. This dataset is specifically designed for supervised learning tasks, supporting the development and evaluation of state-of-the-art models in the geospatial AI domain.
创建时间:
2024-11-11
原始信息汇总

sKwanda_V2: OpenGeoAI-Dataset | Optical Imagery Training Set

数据集概述

sKwanda_V2: OpenGeoAI-Dataset 是一个高分辨率光学影像数据集,旨在支持地理空间机器学习应用的高级研究,如语义分割、土地覆盖分类和空间分析。该数据集提供从航空遥感数据中提取的地理空间参考图像块。图像分为训练、验证和测试三个子集,每个子集包含512 × 512像素的图像块及其对应的地面真值(GT)标签。该数据集特别适用于监督学习任务,支持开发和评估地理空间AI领域的尖端模型。

关键特性

  • 高分辨率影像:数据集包含512 × 512像素的图像块,适用于土地覆盖和空间特征的细粒度分析。
  • 地理空间参考:所有图像均使用NAD83 / UTM Zone 18N坐标系(EPSG: 26918)进行地理配准,确保任务所需的精确映射和基于位置的分析。
  • 光谱波段:数据集包括多个光谱波段,为多光谱分类和植被分析等高级遥感应用提供有价值的信息。
  • 地面真值标签:每个图像块都配有相应的地面真值标签,定义土地覆盖类别(如水、植被、城市等),用于监督分类任务。
  • 开源:数据集公开提供,供非商业研究使用,有助于推动地理空间AI在社会公益和环境监测方面的发展。

数据集结构

数据集分为三个子集:

  • 训练集:用于训练机器学习模型的图像。包含多样化的图像块和标签。
  • 验证集:用于调整模型超参数和验证模型开发阶段的性能。
  • 测试集:用于评估训练模型的最终性能,提供对未见数据的公正评估。

每个图像块为512 × 512像素,数据集包含多个光谱波段,通常包括红、绿、蓝和近红外(NIR)波段。

地理空间元数据

.aux文件包含详细的坐标系统、地理变换和图像波段信息。关键元素包括:

  • 坐标系统(PROJCS):使用NAD83 / UTM Zone 18N(EPSG: 26918)进行地理配准,确保与地理空间软件兼容并实现精确映射。
  • 地理变换(GeoTransform):定义像素坐标如何映射到真实世界坐标,确保从大图像中提取的图块保持空间完整性。
  • 光谱波段:每个图像包含四个波段,包括红、绿、蓝和近红外(NIR)。元数据确保每个波段的NoData值和源索引正确记录。

数据集获取位置

sKwanda_V2数据集在Nyagatare和Rwamagana(左上角为红色A)以及National Agriculture Imagery Program(左上角为红色B)和CheasaBay土地覆盖产品上获取。

使用

安装

通过Google Drive下载数据集(链接在仓库中提供)。

预处理和图块提取

  1. 图块提取:将大型航空图像分割成较小的512 × 512像素图块。此过程确保数据易于管理和准备用于训练深度学习模型。
  2. 地理空间完整性:分割图像时,保留GeoTIFF元数据,包括地理变换和投影系统信息,确保每个提取的图块保持其空间参考。

模型训练

该数据集适用于监督学习任务,特别是在土地覆盖分类和语义分割的背景下。研究人员可以使用此数据集训练深度学习模型,确保模型学习空间模式和全局特征。

评估

使用测试集评估训练模型的性能,使用准确率、IoU(交并比)和F1分数等指标评估模型效能。

许可证和引用

许可证:数据集在非商业许可证下发布,仅供学术和研究使用。如需商业使用,请联系作者。

引用

bibtex @article{Mwubahimana2024sKwanda, title={sKwanda V2: OpenGeoAI Dataset for Optical Imagery Training}, author={Boaz Mwubahimana}, year={2024}, journal={IEEE Journal of Geospatial AI}, volume={XX}, number={YY}, pages={ZZ-ZZ},

致谢

该数据集的创建得到了武汉大学信息工程测量、制图和遥感国家重点实验室行星科学小组的支持。特别感谢Google Earth、L2HNet、Sentinel Hub和ESRI提供的工具和资源。

联系信息

如有任何疑问或合作机会,请联系Boaz Mwubahimana,邮箱:aiboaz1896@gmail.com。

搜集汇总
数据集介绍
main_image_url
构建方式
sKwanda_V2: OpenGeoAI-Dataset的构建基于高分辨率光学影像,旨在支持地理空间机器学习应用的研究。该数据集由航空遥感数据衍生而来,提供了地理空间参考的图像块。这些图像块被组织成训练、验证和测试三个子集,每个子集包含512 × 512像素的图像块及其对应的地面真实标签。数据集的构建过程中,特别注重保持空间完整性和时间一致性,确保模型训练与现实地理环境相符。
特点
sKwanda_V2: OpenGeoAI-Dataset具有多个显著特点。首先,它包含高分辨率的512 × 512像素图像块,适用于对土地覆盖和空间特征进行细粒度分析。其次,所有图像均采用NAD83 / UTM Zone 18N坐标系统进行地理参考,确保了精确的地理定位。此外,数据集包含多个光谱波段,如红、绿、蓝和近红外波段,为多光谱分类和植被分析提供了丰富的信息。最后,每个图像块都附有地面真实标签,适用于监督分类任务。
使用方法
使用sKwanda_V2: OpenGeoAI-Dataset时,首先通过提供的Google Drive链接下载数据集。数据集已预处理为512 × 512像素的图像块,便于训练深度学习模型。在训练模型时,建议使用监督学习方法,特别是土地覆盖分类和语义分割任务。模型训练过程中,应确保保留GeoTIFF元数据,如地理变换矩阵和投影系统信息,以维持空间参考的完整性。训练完成后,可使用测试集评估模型性能,采用准确率、IoU和F1-score等指标进行评估。
背景与挑战
背景概述
sKwanda_V2: OpenGeoAI-Dataset 是一个高分辨率的光学影像数据集,旨在支持地理空间机器学习应用的高级研究,如语义分割、土地覆盖分类和空间分析。该数据集由Boaz Mwubahimana、Yan Jianguo、Swalpa Kumar Roy等研究人员创建,主要用于监督学习任务,推动地理空间AI领域的前沿模型开发与评估。数据集包含从航空遥感数据中提取的512 × 512像素图像块及其相应的地面真值标签,分为训练、验证和测试三个子集。该数据集的发布有助于推动非商业研究,特别是在社会公益和环境监测方面的应用。
当前挑战
sKwanda_V2数据集在构建过程中面临多项挑战。首先,高分辨率图像的处理和分割需要确保空间和光谱的完整性,这要求在数据预处理阶段保持地理参考信息的准确性。其次,数据集的多样性和覆盖范围要求研究人员在不同地理区域进行数据采集和标注,以确保模型的泛化能力。此外,数据集的开放性和非商业使用限制了其应用范围,如何在保持数据集开放性的同时确保其可持续性和长期维护也是一个重要挑战。
常用场景
经典使用场景
sKwanda_V2: OpenGeoAI-Dataset 主要用于支持高级地理空间机器学习应用的研究,如语义分割、土地覆盖分类和空间分析。该数据集提供了高分辨率的光学影像,组织为512 × 512像素的图像块,并附有相应的地面真值标签,适用于监督学习任务。通过这些数据,研究人员可以开发和评估前沿的模型,特别是在地理空间AI领域,确保模型在实际地理环境中的准确性和适用性。
实际应用
在实际应用中,sKwanda_V2: OpenGeoAI-Dataset 被广泛用于环境监测、城市规划、农业管理和灾害评估等领域。通过高分辨率的影像和精确的地理参考信息,该数据集支持开发高效的机器学习模型,用于实时监测土地利用变化、预测自然灾害风险以及优化农业生产。这些应用不仅提高了决策的科学性,还为社会和环境的可持续发展提供了技术支持。
衍生相关工作
sKwanda_V2: OpenGeoAI-Dataset 的发布催生了一系列相关研究和工作,包括基于该数据集的深度学习模型优化、多光谱影像分析方法的创新以及地理空间数据处理技术的改进。例如,研究人员利用该数据集开发了新的卷积神经网络(CNN)和视觉变换器(ViT)模型,显著提升了土地覆盖分类的准确性。此外,该数据集还促进了跨学科的合作,推动了地理信息科学和人工智能的融合发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作