LoveDA

Name: LoveDA
Creator: 武汉大学，信息工程测绘国家重点实验室
Published: 2022-05-31 19:03:05
License: 暂无描述

arXiv2022-05-31 更新2024-06-21 收录

下载链接：

https://github.com/Junjue-Wang/LoveDA

下载链接

链接失效反馈

官方服务：

资源简介：

LoveDA数据集是由武汉大学信息工程测绘国家重点实验室开发的一个高分辨率遥感地表覆盖数据集，包含来自三个不同城市的5987张图像和166768个标注对象。该数据集覆盖城市和农村两个领域，面临多尺度对象、复杂背景样本和类分布不一致等挑战。LoveDA数据集适用于地表覆盖语义分割和无监督域适应（UDA）任务，旨在解决大规模地表覆盖映射中的模型泛化问题。

The LoveDA Dataset is a high-resolution remote sensing land cover dataset developed by the State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University. It contains 5987 images from three different cities and 166,768 annotated objects. The dataset covers two domains: urban and rural areas, and faces challenges such as multi-scale objects, complex background samples, and inconsistent class distributions. The LoveDA Dataset is suitable for land cover semantic segmentation and unsupervised domain adaptation (UDA) tasks, aiming to address the model generalization issue in large-scale land cover mapping.

提供机构：

武汉大学，信息工程测绘国家重点实验室

创建时间：

2021-10-17

搜集汇总

数据集介绍

构建方式

LoveDA数据集源自武汉大学研究团队，旨在推动遥感土地覆盖语义分割中的域自适应研究。其构建基于从南京、常州和武汉三座城市采集的0.3米空间分辨率谷歌地球历史影像，覆盖总面积达536.15平方公里。依据国家统计局发布的城乡划分代码，精心挑选了九个城市化区域与九个乡村区域，共计18个行政单元。影像经几何配准与预处理后，被切割为无重叠的1024×1024像素图像，最终形成包含5987张高分辨率影像和166768个标注对象的数据集。标注流程采用了专业遥感解译人员基于ArcGIS软件的多边形勾绘，并经过自检、互检及抽样质检等多重严格审核，确保了标注的精确性与可靠性。

使用方法

LoveDA数据集支持两种核心任务：语义分割与无监督域自适应。对于语义分割任务，数据被划分为训练集（2522张）、验证集（1669张）和测试集（1796张），所有子集均同时包含城乡场景。对于无监督域自适应任务，则设计了两条跨域迁移路线：从城市到乡村与从乡村到城市。每条路线均明确了源域、目标域以及Oracle设置下的训练、验证和测试影像划分。研究人员可基于此基准，利用论文中提供的11种语义分割方法与8种无监督域自适应方法的评估结果，开展多尺度架构、背景监督、伪标签分析等探索性研究，以推动大规模土地覆盖制图技术的发展。

背景与挑战

背景概述

LoveDA数据集由武汉大学测绘遥感信息工程国家重点实验室的王俊珏、郑卓等研究人员于2021年创建，旨在推动高空间分辨率遥感影像土地覆盖语义分割中的域自适应学习。该数据集包含来自南京、常州和武汉三个城市的5987幅0.3米分辨率影像，覆盖536.15平方公里，并标注了166768个对象，涵盖七类土地覆盖类型。与现有数据集不同，LoveDA首次将城乡场景纳入统一框架，聚焦于解决模型在不同地理景观间的泛化能力不足问题。其发布在NeurIPS 2021数据集与基准赛道，为遥感领域的大规模土地覆盖制图提供了关键基准，显著促进了域自适应语义分割方法的发展。

当前挑战

LoveDA数据集面临三大核心挑战：其一，多尺度对象问题，城乡场景中同一地物类别（如建筑）的尺度差异显著，城市建筑排列整齐且尺度多样，而乡村建筑尺度较小且分布离散，要求模型具备强大的多尺度特征捕获能力。其二，复杂背景样本干扰，高分辨率影像中的背景类（如裸地）呈现极大的类内方差，导致大量地物被误判为背景，引发严重虚警。其三，类分布不一致性，城市场景以人造地物（建筑、道路）为主，乡村则以自然要素（农业、森林）占优，这种分布偏移在无监督域自适应任务中尤为棘手，传统对抗训练方法难以有效对齐类别级特征，而自训练方法虽通过伪标签缓解失衡，但仍面临负迁移风险。

常用场景

经典使用场景

LoveDA数据集专为高空间分辨率遥感图像的土地覆盖语义分割任务而设计，尤其聚焦于城乡场景间的领域自适应问题。该数据集包含来自中国三个城市、覆盖18个行政区的5987幅0.3米分辨率影像，标注了七类地物。其经典使用场景是评估和推动深度学习模型在复杂城乡景观中的分割性能，特别是应对多尺度地物、复杂背景样本以及类别分布不一致等挑战，为大规模土地覆盖制图提供基准。

解决学术问题

该数据集解决了现有高分辨率土地覆盖数据集忽视模型可迁移性的学术瓶颈。传统数据集如DeepGlobe、GID等仅支持单一域内的语义分割，而LoveDA通过明确划分城市与乡村两个域，首次为无监督域适应（UDA）研究提供了真实遥感场景的基准。这揭示了跨域地物尺度、光谱和类别分布的显著差异，促使学界从单纯提升分割精度转向探索模型的泛化能力，推动了域自适应语义分割方法的发展。

实际应用

在实际应用中，LoveDA数据集支撑了大规模、高精度的城市与乡村土地覆盖制图，助力资源规划与生态监测。通过训练可泛化的模型，该数据集减少了人工测绘的人力物力消耗，支持从省级到国家级的遥感自动化解译。例如，其UDA任务可直接用于跨城市或跨区域的建筑、道路、农田等地物的连续监测，为国土调查、农业评估和城市扩张分析提供可靠的数据驱动工具。

数据集最近研究