Sentinel-2 dataset with Dynamic World labels
收藏arXiv2025-05-27 更新2025-05-29 收录
下载链接:
https://zenodo.org/records/15125549
下载链接
链接失效反馈官方服务:
资源简介:
本研究贡献了一个定制的Sentinel-2数据集,包含了Dynamic World标签,专门为湿地分类任务设计,并公开供研究人员使用。数据集使用了Sentinel-2卫星图像,覆盖了荷兰六个湿地区域,并通过深度学习方法进行了预处理。数据集提供了丰富的植被、水体和土壤特征信息,对于湿地生态系统的监测和管理具有重要意义。数据集的构建旨在解决湿地分类任务中标注数据稀缺的问题,通过引入监督学习和自监督学习方法,提高了模型在湿地区域的分割和分类准确性。
This study presents a custom Sentinel-2 dataset equipped with Dynamic World labels, which is specifically designed for wetland classification tasks and made publicly available to researchers. The dataset employs Sentinel-2 satellite imagery covering six wetland areas across the Netherlands, and has been preprocessed via deep learning methods. It provides abundant feature information related to vegetation, water and soil, which holds critical importance for the monitoring and management of wetland ecosystems. The construction of this dataset aims to address the problem of scarce labeled data in wetland classification tasks, and by introducing supervised and self-supervised learning approaches, it enhances the accuracy of model segmentation and classification within wetland regions.
提供机构:
欧洲航天局, 阿姆斯特丹大学, 那不勒斯费德里科二世大学
创建时间:
2025-05-27
搜集汇总
数据集介绍

构建方式
Sentinel-2 dataset with Dynamic World labels的构建采用了多源遥感数据融合的策略,主要基于Sentinel-2卫星的中分辨率影像(10米/像素)和Pléiades NEO的亚米级高分辨率影像。研究团队通过Google Earth Engine平台获取了2017至2024年间云量低于5%的Sentinel-2 Level-2A级数据,精选了包括红边波段、近红外和短波红外在内的9个特征波段。针对高分辨率标注稀缺的挑战,创新性地采用人工标注的高分辨率标签下采样匹配中分辨率数据的方法,并利用Dynamic World的自动分类结果(总体精度73.8%)作为监督信号。数据预处理包含影像分块(256×256像素和1024×1024像素两种规格)、无效像素过滤及直方图均衡化等步骤,最终形成覆盖荷兰六处湿地的地理分区数据集。
特点
该数据集的核心价值在于其多分辨率协同标注体系与专业湿地分类目标的深度结合。中分辨率Sentinel-2数据提供大范围周期性覆盖(重访周期5天),配备Dynamic World的9类土地覆盖标签;高分辨率Pléiades NEO数据(0.3米/像素)则通过人工精细标注补充空间细节。特别值得注意的是,数据集通过直方图均衡化和波段优选(保留对湿地敏感的红边与近红外波段)增强了植被-水体边界的可分性。实验表明,该数据支持U-Net模型达到85.26%的基础分类精度,而自监督预训练策略可进一步提升高分辨率数据的分类性能至88.23%,显著缓解了湿地研究中标注数据稀缺的瓶颈问题。
使用方法
该数据集的使用需结合多尺度分析框架与迁移学习技术。研究者可采用中分辨率数据(10米)进行大范围湿地类型初分类,再通过高分辨率子集(0.3米)实现精细植被边界修正。具体操作时,建议先利用数据集中预分割的训练集(1701张)、验证集(948张)和测试集(1140张)进行模型训练,注意不同湿地区域样本量的自然不均衡特性。对于前沿方法探索,可尝试将自编码器在未标注数据上预训练的权重迁移至U-Net,尤其在高分辨率任务中能获得约28%的精度提升。所有影像均已配准并完成辐射校正,用户可直接提取9个特征波段输入模型,但需注意不同分辨率数据需采用差异化的批处理大小(中分辨率建议batch_size=8,高分辨率建议batch_size=4)以避免显存溢出。
背景与挑战
背景概述
Sentinel-2 dataset with Dynamic World labels是由欧洲航天局(ESA) Φ-lab、那不勒斯费德里科二世大学和阿姆斯特丹大学的研究团队于2025年发布的湿地分类专用数据集。该数据集聚焦荷兰Biesbosch等六个湿地区域,旨在解决湿地生态系统监测中的高分辨率遥感影像标注数据稀缺问题。通过结合Sentinel-2卫星影像和Dynamic World土地覆盖标签,该数据集为监督学习和自监督学习提供了基准测试平台,其基线U-Net模型实现了85.26%的分类准确率。该数据集的发布显著推进了湿地植被制图研究,为生物多样性评估和生态系统管理提供了重要数据支撑。
当前挑战
该数据集面临的核心挑战体现在两个方面:在领域问题层面,湿地植被的复杂光谱特征和动态变化特性导致传统分类方法难以区分草甸与灌木等相似地物类别,Dynamic World标签对这类精细类别的识别准确率仅73.8%;在构建过程层面,高分辨率影像标注需要专业生态学知识且耗时费力,Pléiades NEO影像的标注成本远超Sentinel-2数据,同时多时相影像的云层干扰(需控制云量<5%)和异源数据间的光谱差异(13个波段到9个波段的选择)也增加了数据预处理复杂度。此外,跨分辨率标签缩放(从0.3m到10m)带来的信息损失问题也制约着模型的细粒度分类性能。
常用场景
经典使用场景
Sentinel-2 dataset with Dynamic World labels在湿地植被分类与土地覆盖分割研究中展现了其经典应用价值。该数据集通过整合Sentinel-2卫星的中分辨率影像与Dynamic World的实时土地覆盖标签,为研究者提供了多光谱数据与标准化分类标签的协同分析基础。尤其在荷兰Biesbosch潮汐湿地等动态生态系统中,该数据集支持了U-Net架构的语义分割模型训练,实现了85.26%的基础分类准确率,成为验证自监督学习与多分辨率对比研究的基准平台。
解决学术问题
该数据集有效解决了湿地遥感领域两大核心问题:标注数据稀缺性与多分辨率数据协同分析的挑战。通过Dynamic World标签的规模化应用,缓解了高分辨率影像人工标注成本高昂的困境;其设计的标签降采样框架则实现了不同空间分辨率数据间的知识迁移,为跨尺度地物分类提供了方法论创新。实验证明自监督预训练策略可使高分辨率影像分类准确率提升27.88%,显著降低了深度学习对标注数据的依赖。
衍生相关工作
该数据集催生了多个湿地遥感创新研究,包括基于自动编码器的光谱特征无监督提取方法、多时相影像的植被动态监测框架等。其数据预处理流程被后续研究如Butko等(2024)的植被分区工作直接采用,而提出的分辨率适配策略为Dahiya等(2024)的卫星图像分割研究提供了重要参考。数据集构建方法论更启发了类似生态区域的标准化数据产品开发。
以上内容由遇见数据集搜集并总结生成



