OpenEarthMap generalized few-shot semantic segmentation (OEM-GFSS) dataset
收藏arXiv2024-09-17 更新2024-09-19 收录
下载链接:
https://zenodo.org/records/11396874
下载链接
链接失效反馈官方服务:
资源简介:
OpenEarthMap generalized few-shot semantic segmentation (OEM-GFSS) dataset是由日本理化学研究所先进智能项目中心(AIP)地理信息团队创建的,用于遥感图像的广义少样本语义分割任务。该数据集扩展了OpenEarthMap的8类粗粒度土地覆盖标签至15类细粒度标签,包含408张图像,来自97个地理区域的73个区域。数据集的创建过程包括手动标注和质量检查,旨在解决低资源环境下土地覆盖映射的问题,适用于遥感图像理解和土地覆盖分类等应用。
The OpenEarthMap Generalized Few-Shot Semantic Segmentation (OEM-GFSS) dataset was developed by the Geospatial Information Team at the Center for Advanced Intelligence Project (AIP), RIKEN, Japan, for generalized few-shot semantic segmentation tasks of remote sensing imagery. This dataset expands the 8-class coarse-grained land cover labels from OpenEarthMap to 15-class fine-grained labels, and contains 408 images sourced from 73 regions across 97 geographic areas. The dataset construction involved manual annotation and quality inspection, aiming to address the challenge of land cover mapping in low-resource settings, and is applicable to applications such as remote sensing image understanding and land cover classification.
提供机构:
日本理化学研究所先进智能项目中心(AIP)地理信息团队
创建时间:
2024-09-17
搜集汇总
数据集介绍

构建方式
OEM-GFSS数据集的构建基于OpenEarthMap数据集,通过扩展其原有的8类粗粒度土地覆盖标签至15类细粒度标签。研究团队从OpenEarthMap的测试集中筛选出包含新定义类别的图像,并进行手动标注。标注过程包括初始标注、双人质量检查及必要时的第三方验证,确保标注的准确性和一致性。最终,数据集包含408张图像,来自全球73个地理区域,每张图像的分辨率为1024×1024,空间分辨率为0.25–0.5m。
特点
OEM-GFSS数据集的主要特点在于其细粒度标注和广泛的地理覆盖。数据集不仅涵盖了基础的土地覆盖类别,还引入了新的细粒度类别,如车辆与货运拖车、停车场、运动场等,增强了数据集的多样性和实用性。此外,数据集的全球分布确保了模型在不同地理环境下的泛化能力,使其成为研究广义少样本语义分割的理想平台。
使用方法
OEM-GFSS数据集适用于广义少样本语义分割任务,特别适合于需要从有限标注数据中学习并适应新类别的深度学习模型。用户可以利用该数据集进行模型的预训练和微调,通过训练集中的基础类别图像进行模型初始化,然后使用验证集和测试集中的新类别图像进行少样本学习。数据集的发布还包括了基准模型和挑战结果,为研究人员提供了性能评估的参考。
背景与挑战
背景概述
OpenEarthMap generalized few-shot semantic segmentation (OEM-GFSS)数据集由RIKEN、东京大学和Ontario Tech University的研究团队共同创建,旨在解决遥感领域中有限标注数据下的语义分割问题。该数据集于2024年发布,作为OpenEarthMap数据集的扩展,增加了15个细粒度类别,涵盖了全球6大洲的73个地理区域。OEM-GFSS数据集的推出填补了遥感领域在广义少样本语义分割方面的空白,为研究人员提供了一个基准,推动了低资源环境下土地覆盖映射任务的研究。
当前挑战
OEM-GFSS数据集面临的挑战主要集中在两个方面:一是如何在有限标注数据的情况下,使深度学习模型能够有效适应新类别,同时保持对基础类别的强识别能力;二是数据集构建过程中,如何确保新类别标注的准确性和一致性,以及如何处理地理区域间的数据分布不均问题。此外,该数据集还面临着如何在广义少样本分割设置下,平衡基础类别和新类别性能的挑战,这需要在模型训练和评估中引入新的策略和方法。
常用场景
经典使用场景
在遥感领域,OpenEarthMap generalized few-shot semantic segmentation (OEM-GFSS) 数据集的经典使用场景主要集中在广义少样本语义分割任务上。该数据集通过提供细粒度的地表覆盖标签,支持模型在仅有限标注数据的情况下,对新类别进行有效分割。具体应用包括对不同地理区域的卫星图像进行地表覆盖分类,如森林、农田、水体等,以及识别和分割新引入的地物类别,如车辆、船只等。
实际应用
在实际应用中,OEM-GFSS 数据集被广泛用于开发和验证少样本学习算法,特别是在资源有限的环境下。例如,在灾害监测和响应中,快速识别和分割新出现的地物类别(如倒塌的建筑物、临时避难所等)至关重要。此外,该数据集还可用于农业监测、城市规划和环境管理等领域,通过少样本学习技术提高地表覆盖分类的准确性和效率。
衍生相关工作
基于 OEM-GFSS 数据集,研究者们开发了多种少样本学习算法和模型,如 SegLand、ClassTrans、FoMA 和 P-SegGPT 等。这些工作不仅在数据集上取得了显著的性能提升,还提出了多种创新策略,如使用基础模型的知识蒸馏、多尺度特征融合和可学习提示技术等。这些衍生工作进一步推动了少样本语义分割技术在遥感领域的应用和发展。
以上内容由遇见数据集搜集并总结生成



