BigEarthNet
收藏arXiv2021-06-13 更新2024-07-30 收录
下载链接:
http://bigearth.net/#downloads
下载链接
链接失效反馈官方服务:
资源简介:
BigEarthNet是一个大规模的Sentinel-2多光谱图像数据集,采用了新的分类命名法,以推进遥感图像理解的深度学习研究。该数据集包含590,326个图像块,这些图像块根据2018年CORINE土地覆盖地图的最详细三级分类命名法进行了多标签注释。
BigEarthNet is a large-scale Sentinel-2 multispectral image dataset that adopts a novel classification nomenclature to advance deep learning research on remote sensing image understanding. This dataset contains 590,326 image patches, which are multi-label annotated in accordance with the most detailed three-level classification nomenclature of the 2018 CORINE Land Cover Map.
创建时间:
2020-01-17
搜集汇总
数据集介绍

构建方式
在遥感影像分析领域,大规模高质量标注数据集的稀缺制约了深度学习模型的进展。BigEarthNet的构建过程体现了系统性设计理念,其基础数据来源于2017年6月至2018年5月期间采集的125幅Sentinel-2卫星影像瓦片,这些瓦片覆盖欧洲10个国家且云覆盖率均低于1%。通过大气校正工具sen2cor处理后,原始瓦片被切割为590,326个非重叠图像块,并根据不同波段的空间分辨率分别生成120×120像素(10米波段)、60×60像素(20米波段)及20×20像素(60米波段)的标准尺寸。标注体系则创新性地重构了CORINE土地覆盖地图的三级分类系统,通过融合光谱特征相似类别、剔除依赖时序或土地利用概念的类别,最终形成包含19个类别的多标签标注体系,每个图像块可对应1至12个类别标签。
使用方法
该数据集为遥感影像理解研究提供了标准化实验框架。在数据预处理阶段,建议排除受云层、阴影及积雪完全覆盖的70,987个样本,并可根据研究需求选择10米与20米空间分辨率的11个有效波段。针对多标签分类任务,数据集已按地理相邻性原则划分为训练集(269,695样本)、验证集(123,723样本)与测试集(125,866样本),确保空间独立性。研究者可采用VGG、ResNet等经典架构进行端到端训练,亦可利用其提供的K-Branch CNN分支网络处理多分辨率光谱数据。实验表明,基于BigEarthNet从头训练的ResNet152模型在农业植被类别的F1分数较ImageNet预训练模型提升超过46%,验证了领域特定数据集对复杂地物识别的增强作用。数据集还可拓展应用于图像检索、半监督学习及多源数据融合等前沿方向。
背景与挑战
背景概述
遥感影像理解领域在深度学习技术的推动下,对大规模标注数据集的需求日益迫切。BigEarthNet数据集由欧洲研究团队于2019年构建,旨在解决遥感影像多标签分类任务中数据稀缺的瓶颈。该数据集基于Sentinel-2多光谱影像,包含590,326个影像斑块,覆盖欧洲10个国家的地表类型,并采用CORINE土地覆盖地图的2018年数据作为标注来源。其核心研究问题在于如何通过大规模、高质量的多标签数据集,推动深度学习模型在复杂地表类型识别中的性能提升。BigEarthNet通过重新设计类别命名体系,将原始43个类别整合为19个更具光谱与空间表征能力的类别,显著提升了模型对农业、植被及自然环境的分类精度,为遥感影像分析领域提供了重要的基准资源。
当前挑战
BigEarthNet数据集面临的挑战主要体现在两个方面:在领域问题层面,遥感影像多标签分类任务本身具有复杂性,影像中常包含多种语义内容,需同时识别多个土地覆盖类别,且部分类别如工业区、沿海湿地等因光谱特征相似或空间模式复杂而难以准确区分。在构建过程中,数据采集与标注面临显著困难:Sentinel-2影像具有多波段、多分辨率特性,需处理不同空间分辨率的波段对齐问题;原始CORINE标注依赖土地利用概念,部分类别无法仅从单时相影像中可靠识别,需重新设计类别体系以匹配影像特性;此外,数据清洗需剔除大量被云、雪覆盖的影像,确保数据质量适用于深度学习模型训练。
常用场景
经典使用场景
在遥感影像分析领域,BigEarthNet数据集以其大规模多标签标注的Sentinel-2多光谱影像块,为深度学习模型提供了丰富的训练资源。该数据集最经典的使用场景在于多标签场景分类任务,研究人员利用其59万多个影像块及其对应的19类土地覆盖标签,训练卷积神经网络模型以识别复杂地表覆盖类型。通过对比VGG、ResNet及K-Branch CNN等先进架构,该数据集验证了从零开始训练模型在遥感影像分类中的优越性,特别是在农业用地、混合植被等复杂类别上展现出显著性能提升。
解决学术问题
BigEarthNet数据集有效解决了遥感影像分析中大规模标注数据匮乏的学术难题。传统遥感数据集往往规模有限且多为单标签标注,难以支撑深度学习模型对复杂多标签场景的建模需求。该数据集通过重构CORINE土地覆盖分类体系,形成了更符合Sentinel-2影像特性的19类多标签体系,为多标签分类、跨域迁移学习等研究提供了基准测试平台。其实验结果表明,直接在遥感数据上训练的模型性能显著优于基于ImageNet的预训练模型,这为遥感领域专用预训练模型的开发提供了实证依据。
实际应用
在实际应用层面,BigEarthNet数据集支撑着土地覆盖制图、环境监测和农业管理等重要领域。基于该数据集训练的深度学习模型可用于自动化生成大范围土地覆盖分类产品,辅助政府部门进行自然资源调查和国土空间规划。在气候变化研究方面,模型能够持续监测植被动态、湿地变化等关键指标。农业领域则可借助分类结果实现作物类型识别和种植结构分析,为精准农业提供数据支持。数据集涵盖的欧洲多国影像也为跨境生态环境研究提供了统一基准。
数据集最近研究
最新研究方向
在遥感影像理解领域,BigEarthNet数据集凭借其大规模Sentinel-2多光谱影像及多标签标注体系,已成为推动深度学习研究的关键资源。当前前沿研究聚焦于利用该数据集优化多标签分类模型,特别是针对复杂地物类别的识别。研究热点包括探索专门针对遥感影像特性的网络架构,如K-Branch CNN,以更有效地融合不同空间分辨率的光谱信息;同时,验证从零开始训练模型相较于基于ImageNet预训练模型的优越性,尤其在农业用地、混合植被等复杂场景的分类任务中表现显著。这些进展不仅提升了土地覆盖分类的精度,也为大规模遥感影像的自动化解译提供了可靠基准,对全球环境监测、精准农业及气候变化研究具有深远影响。
相关研究论文
- 1BigEarthNet Dataset with A New Class-Nomenclature for Remote Sensing Image Understanding · 2021年
以上内容由遇见数据集搜集并总结生成



