BigEarthNet
收藏arXiv2019-06-07 更新2024-06-21 收录
下载链接:
http://bigearth.net
下载链接
链接失效反馈官方服务:
资源简介:
BigEarthNet是由柏林工业大学创建的大型多标签Sentinel-2基准档案,包含590,326个Sentinel-2图像块,每个图像块根据不同分辨率分为120x120、60x60和20x20像素。数据集通过CORINE Land Cover 2018数据库进行多标签注释,旨在解决现有遥感图像档案的局限性,特别是在深度学习训练中的应用。BigEarthNet不仅规模庞大,而且支持多标签分类,适用于深度学习模型的训练,特别是在遥感图像场景分类问题中显示出高准确性。
BigEarthNet is a large-scale multi-label Sentinel-2 benchmark archive created by the Technical University of Berlin, which contains 590,326 Sentinel-2 image patches. Each patch is categorized into three distinct resolutions: 120×120, 60×60, and 20×20 pixels. The dataset is annotated with multi-labels using the CORINE Land Cover 2018 database, aiming to address the limitations of existing remote sensing image archives, particularly for deep learning training applications. Boasting a massive scale and native support for multi-label classification, BigEarthNet is well-suited for training deep learning models and has exhibited high accuracy in remote sensing image scene classification tasks.
提供机构:
柏林工业大学
创建时间:
2019-02-17
搜集汇总
数据集介绍

构建方式
在遥感影像分析领域,大规模标注数据集的稀缺长期制约着深度学习技术的应用。BigEarthNet的构建过程始于从2017年6月至2018年5月期间,精心筛选了125幅云覆盖率低于1%的Sentinel-2卫星影像瓦片,这些瓦片覆盖欧洲十个国家。所有瓦片均经过大气校正处理,并排除了不包含地表信息的第10波段。随后,将这些瓦片分割为590,326个非重叠的图像块,每个图像块依据不同空间分辨率的波段划分为120×120像素(10米波段)、60×60像素(20米波段)以及20×20像素(60米波段)。每个图像块的标注来源于2018年CORINE土地覆盖数据库,采用多层次标签体系,确保了每个影像块可能对应一个至多个土地覆盖类别,从而真实反映了遥感影像中普遍存在的多类别共存现象。
特点
BigEarthNet作为遥感领域首个大规模多标签基准数据集,其最显著的特点在于庞大的数据规模和精细的多标签标注体系。该数据集包含超过59万张Sentinel-2影像块,远超现有遥感数据集的数量级,为训练复杂的深度神经网络提供了充足的样本支持。影像块涵盖13个光谱波段,空间分辨率从10米到60米不等,完整保留了多光谱遥感数据的丰富信息。标注体系基于CORINE土地覆盖分类标准,包含43个精细的土地覆盖类别,每个影像块可能关联1至12个标签,其中95%的影像块拥有不超过5个标签,准确刻画了地表覆盖的复杂性。数据集还涵盖了不同季节的影像,尽管冬季影像数量相对较少,但仍为模型训练提供了时序多样性。
使用方法
BigEarthNet为遥感影像理解任务提供了强大的训练与评估基础,尤其在场景分类、图像检索等方向展现出重要价值。研究人员可直接使用该数据集从头训练深度学习模型,例如论文中采用的浅层卷积神经网络,仅利用RGB波段或全部光谱波段进行训练,均取得了优于在ImageNet上预训练模型的效果。在使用前,建议排除数据集中标注为被积雪、云层或云影完全覆盖的70,987张影像,以确保训练数据的质量。数据集支持按照60%、20%、20%的比例随机划分训练集、验证集和测试集,便于进行模型训练与性能评估。此外,基于BigEarthNet训练的模型可作为预训练权重,迁移至其他遥感任务中,有效推动大规模卫星影像分析算法的发展。
背景与挑战
背景概述
遥感影像理解领域长期受限于大规模标注数据的匮乏,制约了深度学习技术的深入应用。BigEarthNet由柏林工业大学与德国人工智能研究中心的Gencer Sumbul、Begüm Demir等学者于2019年推出,旨在构建首个大规模多标签Sentinel-2卫星影像基准数据集。该数据集涵盖590,326个影像斑块,覆盖欧洲十国不同季节的地表景观,并依托2018年CORINE土地覆盖数据库进行多标签标注。其核心研究问题在于突破传统遥感数据规模小、标注单一的瓶颈,为土地覆盖分类、场景理解等任务提供丰富的训练资源,显著推动了深度学习在遥感领域的范式转移。
当前挑战
BigEarthNet致力于解决遥感影像多标签分类的复杂挑战,其核心在于处理地表覆盖类别的多样性与共存性,例如同一影像中可能同时包含森林、农田和水体等多种类型。数据构建过程中面临多重困难:Sentinel-2影像的多光谱波段具有不同空间分辨率,需协调10米、20米和60米波段的数据对齐;云层与季节性积雪污染导致大量影像无法使用,需通过严格筛选保证数据质量;CORINE土地覆盖标签存在类别不均衡问题,部分稀有类别样本量极少,影响模型训练的泛化能力。此外,多标签标注体系引入了标签共现与语义关联的复杂性,对分类算法的设计提出了更高要求。
常用场景
经典使用场景
在遥感影像理解领域,BigEarthNet作为大规模多标签Sentinel-2基准数据集,其经典使用场景聚焦于遥感影像场景分类任务。该数据集通过提供59万张包含多光谱通道的影像斑块,并标注了基于CORINE土地覆盖数据库的多重标签,为深度学习模型提供了充足的训练样本。研究人员通常利用该数据集训练卷积神经网络,以验证模型在复杂地表覆盖分类任务中的性能表现,特别是在处理多标签分类问题时展现出显著优势。
实际应用
在实际应用层面,BigEarthNet为大规模卫星影像的自动化解译提供了关键支撑。基于该数据集训练的模型可广泛应用于土地覆盖监测、农业资源调查、城市扩张分析等业务化遥感应用。例如,在欧盟共同农业政策监测中,利用该数据集训练的模型能够高效识别复杂种植模式;在自然灾害评估中,可快速提取受灾区域的土地覆盖变化信息。这些应用显著提升了遥感数据在环境保护和资源管理决策中的实用价值。
衍生相关工作
BigEarthNet的发布催生了遥感深度学习领域的系列经典研究工作。在方法层面,研究者基于该数据集开发了多标签注意力网络、图卷积网络等新型架构,以更好地处理遥感影像中的多标签关联性。在应用层面,衍生出BigEarthNet-MM多模态扩展版本,融合了Sentinel-1雷达数据。此外,该数据集还促进了遥感预训练模型的发展,如Sen2Vec等专门针对遥感特性的表示学习方法,这些工作共同推动了遥感影像理解技术的进步。
以上内容由遇见数据集搜集并总结生成



