OpenEarthMap
收藏arXiv2022-10-20 更新2024-06-21 收录
下载链接:
https://open-earth-map.org
下载链接
链接失效反馈官方服务:
资源简介:
OpenEarthMap是由日本理化学研究所人工智能与大数据平台创建的一个全球高分辨率土地覆盖制图基准数据集。该数据集包含220万段,由5000张航空和卫星图像组成,覆盖了全球97个区域,涉及44个国家,横跨6大洲。数据集提供了0.25-0.5米地面采样距离的8类土地覆盖标签,包括裸地、牧场、开发空间、道路、树木、水域、农业用地和建筑物。通过手动标注确保高质量的标注,旨在为全球范围内的自动化制图提供支持。OpenEarthMap不仅在地理多样性上有所突破,还在标注质量上进行了优化,使其成为推动理论与实践进步的宝贵资源。数据集的应用领域广泛,包括土地使用规划、食品安全、资源管理和灾害响应等决策支持。
OpenEarthMap is a benchmark dataset for global high-resolution land cover mapping developed by the RIKEN Center for Artificial Intelligence and Big Data, Japan. This dataset consists of 2.2 million segments derived from 5,000 aerial and satellite images, covering 97 regions across 44 countries and 6 continents. It provides eight categories of land cover labels with a ground sampling distance of 0.25–0.5 meters, including bare land, pasture, developed areas, roads, trees, water bodies, agricultural land, and buildings. High-quality annotations are ensured through manual labeling, and the dataset is intended to support global-scale automated land cover mapping. Beyond its breakthrough in geographic diversity, OpenEarthMap has also optimized its annotation quality, making it a valuable resource for advancing both theoretical and practical advancements in the field. The dataset has wide-ranging applications for decision support, including land use planning, food security, resource management, and disaster response.
提供机构:
日本理化学研究所人工智能与大数据平台
创建时间:
2022-10-20
搜集汇总
数据集介绍

构建方式
在遥感影像分析领域,高分辨率土地覆盖制图对全球环境监测与规划至关重要。OpenEarthMap数据集通过整合现有基准数据集(如xBD、Inria、SpaceNet等)的RGB图像,并补充来自公开平台(如OpenAerialMap和各国地理机构)的影像,构建了一个涵盖全球44个国家、97个区域、共5000张图像的集合。所有图像均经过人工精细标注,形成八类土地覆盖标签,地面采样距离为0.25–0.5米。为确保地理多样性与类别平衡,数据集采用随机采样与手动筛选相结合的策略,并针对区域差异添加了亚洲、非洲和南美洲的公开影像,最终包含220万个标注片段。
特点
OpenEarthMap数据集以其卓越的地理多样性与精细的标注质量脱颖而出。它覆盖全球六大洲,影像来源包括卫星、航空器和无人机平台,有效缓解了现有数据集中发达国家偏倚的问题。数据集的八类标签(裸地、牧场、开发空间、道路、树木、水体、农业用地和建筑)定义一致且比例相对均衡,标注空间细节丰富,每个图像的片段数量显著高于同类数据集。此外,数据集提供了针对语义分割和无监督域适应任务的标准化划分,支持区域级和大陆级的域差距研究,为模型泛化能力评估提供了坚实基础。
使用方法
OpenEarthMap数据集适用于高分辨率土地覆盖语义分割模型的训练与评估。用户可按照6:1:3的比例使用预划分的训练、验证和测试集进行模型开发,或利用其区域级与大陆级划分探索无监督域适应问题。数据集支持多种深度学习架构的基准测试,包括CNN和Transformer模型,并可用于自动化神经架构搜索以开发轻量级模型。此外,预训练的OpenEarthMap模型可作为全球土地覆盖制图的即用工具,通过微调或直接推理应用于新的遥感影像,提升跨区域映射的泛化性能。
背景与挑战
背景概述
高分辨率土地覆盖制图在全球环境监测与资源管理中扮演着关键角色,然而现有数据集常受限于区域偏见与标注质量。OpenEarthMap数据集由RIKEN AIP与东京大学的研究团队于2022年推出,旨在构建一个覆盖全球97个区域、包含220万标注片段的基准数据集。该数据集通过整合多源亚米级遥感影像,提供了八类精细土地覆盖标签,有效解决了传统数据集中发展中国家代表性不足与标注粗糙的问题,为全球尺度的高精度土地覆盖分类模型训练与评估奠定了新的基础。
当前挑战
OpenEarthMap面临的挑战主要体现在领域问题与构建过程两方面。在领域问题上,亚米级土地覆盖分类需应对复杂场景中地物边界模糊、光谱特征相似(如农田与草地的混淆)以及建筑与道路的精细分割难题。构建过程中,研究团队需克服全球影像数据的地理分布不均、多平台数据融合的异构性以及人工标注的高成本与一致性维护等障碍,这些因素共同构成了数据集开发的核心挑战。
常用场景
经典使用场景
在遥感影像分析领域,高分辨率土地覆盖分类是支撑全球环境监测与城市规划的核心任务。OpenEarthMap数据集以其0.25–0.5米地面采样距离的精细标注,为语义分割模型提供了全球范围内多样化的训练样本。该数据集覆盖六大洲44个国家的97个区域,包含220万标注片段,使得模型能够学习到从城市建筑到自然植被的广泛地物特征,从而在土地覆盖制图任务中实现高精度与强泛化能力。
实际应用
OpenEarthMap数据集的实际应用价值体现在全球高分辨率土地覆盖制图的自动化支持上。训练后的模型可作为即用工具,服务于灾害响应、资源管理和城市规画等领域。例如,在灾后评估中,模型能快速生成受损区域的精细土地覆盖图,辅助决策制定;在环境保护中,可实现植被变化监测与水体系统分析。其轻量级模型设计还适应了计算资源有限的边缘设备,促进了实地快速测绘的可行性。
衍生相关工作
基于OpenEarthMap数据集,研究者已开展多项经典工作,涵盖了语义分割、无监督域适应和神经架构搜索等方向。在语义分割方面,U-Net、SegFormer和UPerNet等模型在该数据集上进行了性能评估与优化。无监督域适应研究中,DAFormer等方法利用数据集的地理多样性,探索了跨大陆与区域级的域适应挑战。此外,SparseMask和FasterSeg等自动化神经架构搜索技术被应用于设计轻量级分割网络,为资源受限环境下的实时制图提供了基础模型。
以上内容由遇见数据集搜集并总结生成



