SSL4EO-S12-downstream
收藏Hugging Face2025-05-13 更新2025-03-12 收录
下载链接:
https://huggingface.co/datasets/embed2scale/SSL4EO-S12-downstream
下载链接
链接失效反馈官方服务:
资源简介:
SSL4EO-S12-downstream数据集是一个用于地球观测的自监督学习挑战的数据集。它包含了Sentinel-1和Sentinel-2卫星数据,分为开发集和测试集。开发集包含5149个数据立方体,测试集包含8111个数据立方体。每个数据立方体包含一个位置的四次采样数据,分别对应不同季节。数据立方体以zarr文件格式存储,每个文件包含27个通道,代表两种极化方式(VV和VH)的S1数据和13个S2 L1C通道以及12个S2 L2A通道。
The SSL4EO-S12-downstream dataset is a benchmark dataset for self-supervised learning challenges in Earth Observation (EO). It comprises Sentinel-1 and Sentinel-2 satellite data, split into a development set and a test set. The development set contains 5149 data cubes, while the test set includes 8111 data cubes. Each data cube holds four sampled observations from a single geographic location, corresponding to distinct seasons. All data cubes are stored in Zarr file format, with each file containing 27 channels: Sentinel-1 data with two polarization modes (VV and VH), 13 Sentinel-2 L1C bands, and 12 Sentinel-2 L2A bands.
创建时间:
2025-05-07
原始信息汇总
SSL4EO-S12-downstream 数据集概述
基本信息
- 许可证: CC-BY-4.0
- 数据集名称: SSL4EO-S12-downstream
- 任务类别: 其他
- 语言: 英语
- 标签: 地球观测, 卫星影像, Sentinel
数据集内容
- 开发集: 5149 个数据立方体,约 60 GB
- 测试集: 8111 个数据立方体,约 90 GB
- 数据格式: 数据立方体存储在 zipped zarr 文件中
- 数据组织:
- 开发集路径:
data_dev/* - 测试集路径:
data_eval/* - 每个模态(s1, s2l1c, s2l2a)有单独的子文件夹
- 开发集路径:
数据立方体结构
- 维度: (1, 4, 27, 264, 264)
- 1 个位置
- 4 个时间戳(分别对应 3-5 月、6-8 月、9-11 月、12-2 月)
- 27 个通道:
- Sentinel-1: VV 和 VH 极化
- Sentinel-2 L1C: B1, B2, B3, B4, B5, B6, B7, B8, B8A, B9, B10, B11, B12
- Sentinel-2 L2A: B1, B2, B3, B4, B5, B6, B7, B8, B8A, B9, B11, B12
- 264x264 的空间分辨率
相关资源
相关文献
- Blumenstiel, B., et al. (2025). "SSL4EOS12 v1.1 - A Multimodal, Multiseasonal Dataset for Pretraining." arXiv preprint arXiv:2503.00168.
- Wang, Y., et al. (2022). "SSL4EO-S12: A Large-Scale Multi-Modal, Multi-Temporal Dataset for Self-Supervised Learning in Earth Observation." arXiv preprint arXiv:2211.07044.
搜集汇总
数据集介绍

构建方式
SSL4EO-S12-downstream数据集的构建基于SSL4EOS12 v1.1数据集,涵盖了Sentinel-1和Sentinel-2卫星数据。该数据集针对每个地理位置,收集了春季、夏季、秋季和冬季四个季节的数据,每个数据集包含两种极化方式(VV和VH)、两种级别(L1C和L2A)的13个和12个波段数据,以及对应的时间戳信息,并以zarr压缩格式存储,便于高效访问和处理。
特点
该数据集的主要特点在于其多模态、多时相的特性,提供了丰富的卫星影像信息,有助于进行地球观测领域的研究。数据集的结构与SSL4EOS12 v1.1相同,确保了研究的一致性和延续性。此外,其开放的数据许可(cc-by-4.0)使得数据易于共享和重用。
使用方法
使用该数据集时,用户需先解压zarr格式的数据文件,并按照数据集的结构进行加载。具体加载方法可参考相关教程。数据集适用于自我监督学习、模型预训练等研究,用户可根据具体任务需求,对数据进行相应的预处理和模型训练。
背景与挑战
背景概述
SSL4EO-S12-downstream数据集,作为地球观测领域的重要资源,旨在推进卫星影像的自监督学习研究。该数据集的创建可追溯至2025年,由Blumenstiel等研究人员基于SSL4EOS12 v1.1数据集进一步开发。其核心研究问题聚焦于多模态、多季节卫星数据的预处理与特征提取,对提升地球系统模型的理解与预测能力具有显著影响。SSL4EO-S12-downstream的构建,不仅体现了科研团队在数据集创新方面的努力,也为相关领域的研究提供了强有力的数据支撑。
当前挑战
在数据集构建与应用过程中,研究者面临了多项挑战。首先,如何有效整合来自Sentinel-1和Sentinel-2卫星的不同模态、不同时相的数据,保证数据质量与一致性,是一大难题。其次,数据集的大规模特性要求高效率的数据加载与处理方法,这对数据管理提出了更高的技术要求。此外,如何在自监督学习框架下,利用这些多源异构数据解决实际地球观测问题,也是当前研究必须克服的挑战。
常用场景
经典使用场景
SSL4EO-S12-downstream数据集,作为地球观测领域的重要资源,其经典使用场景主要在于卫星图像的预处理和特征提取。该数据集包含了Sentinel-1和Sentinel-2的多种模态和季节性数据,为研究者提供了丰富的信息,以便于开展卫星图像的自动标注、分类和识别等任务,进而为地球系统监测提供技术支撑。
衍生相关工作
基于SSL4EO-S12-downstream数据集,学术界衍生出了一系列相关工作,如自监督学习算法的改进、卫星图像融合技术的研究以及多时相图像分析模型的开发。这些工作不仅推动了地球观测领域的技术进步,也为相关交叉学科的发展提供了数据支持和启示。
数据集最近研究
最新研究方向
SSL4EO-S12-downstream数据集是在地球观测领域的一项重要成果,其最新研究方向聚焦于利用Sentinel-1和Sentinel-2卫星数据,通过自监督学习进行季节性变化分析。该数据集为研究提供了5149个数据立方体,涵盖春季、夏季、秋季和冬季四个季节,包含了多种卫星模态和时间序列,为深入探索地球表面变化提供了丰富的信息资源。当前研究正致力于通过这一数据集,开发能够捕捉和解析地球表面动态变化的高级模型,这对于自然灾害预警、环境监测以及气候研究等领域具有重要意义。
以上内容由遇见数据集搜集并总结生成



