five

SSL4EO-S12 v1.1

收藏
github2025-03-21 更新2025-03-09 收录
下载链接:
https://github.com/DLR-MF-DAS/SSL4EO-S12-v1.1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包括246,144个位置,每个位置有四个时间戳,涵盖S2L1C、S2L2A、S1GRD和S2RGB四种模态。数据存储在3,846个Zarr Zip文件中,每个文件包含64个样本(唯一位置),每个样本有四个时间戳。元数据与样本一起存储为额外的数据变量。

This dataset contains 246,144 geographic locations, each paired with four timestamps, and encompasses four modalities: S2L1C, S2L2A, S1GRD, and S2RGB. All data is stored in 3,846 Zarr Zip files, with each file holding 64 samples (unique locations), each of which includes four timestamps. Metadata is stored alongside the samples as additional data variables.
创建时间:
2025-03-05
原始信息汇总

SSL4EO-S12 v1.1 数据集概述

数据集描述

SSL4EO-S12 v1.1 是一个更新的地球观测预训练数据集,基于流行的 SSL4EO-S12 数据集。该数据集包含了 246,144 个位置,每个位置有四个时间戳,涵盖了 S2L1C、S2L2A、S1GRD 和 S2RGB 四种模态。

数据内容

  • 数据规模:246,144 个位置,每个位置包含四个时间戳。
  • 模态:S2L1C、S2L2A、S1GRD 和 S2RGB。
  • 存储格式:数据以 3,846 个 Zarr Zip 文件存储,每个文件包含 64 个样本。
  • 时间戳处理:时间戳单独分块,以便高效加载单个时间戳。

数据示例

  • S2L2A xarray 数据集:包含 12 个波段,64 个样本,4 个时间戳,每个样本大小为 264x264。
  • S1GRD xarray 数据集:包含 2 个波段,64 个样本,4 个时间戳,每个样本大小为 264x264。

元数据

  • 提供了基于 S2 的元数据 Parquet 文件,可用于读取和验证数据。

下载

  • 数据可以通过 Julich DataHub 下载。
  • 提供了下载脚本来递归下载所有数据或指定子目录的数据。

使用

  • 提供了 PyTorch 数据集代码,可用于初始化数据加载器。
  • 支持 TerraTorch 的 GenericMultiModalDataModule,提供了配置示例。

标准化值

  • 提供了各种模态的平均值和标准差,用于数据标准化。

许可

  • 代码仓库遵循 Apache 2.0 许可。
  • 数据集遵循 CC-BY-4.0 许可。

引用

  • 使用该数据集时,请引用相关论文。

SSL4EO-S12 v1.1 数据集概述

数据集描述

  • 更新的地球观测预训练数据集
  • 基于 SSL4EO-S12 数据集

数据内容

  • 位置数量:246,144 个
  • 时间戳:每个位置四个
  • 模态:S2L1C、S2L2A、S1GRD、S2RGB
  • 存储格式:Zarr Zip 文件
  • 时间戳处理:单独分块

数据示例

  • S2L2A xarray 数据集:12 个波段,64 个样本,4 个时间戳,264x264 大小
  • S1GRD xarray 数据集:2 个波段,64 个样本,4 个时间戳,264x264 大小

元数据

  • Parquet 文件存储元数据

下载

使用

  • PyTorch 数据集代码
  • 支持 TerraTorch 配置

标准化值

  • 提供平均值和标准差

许可

  • 代码:Apache 2.0
  • 数据集:CC-BY-4.0

引用

  • 引用相关论文
搜集汇总
数据集介绍
main_image_url
构建方式
SSL4EO-S12 v1.1数据集是在原有SSL4EO-S12数据集基础上更新而来,包含来自四种模态(S2L1C、S2L2A、S1GRD和S2RGB)的246,144个位置,每个位置具有四个时间戳。数据集的构建采用了Zarr Zip文件格式,该格式支持高效的数据存储和加载。每个Zarr文件包含64个样本(即64个独特位置),每个样本包含四个时间戳。时间戳分别进行分块处理,以便单独加载,从而优化内存管理。
使用方法
使用该数据集时,用户可以通过wget命令从Julich DataHub下载所需数据。数据加载方面,提供了PyTorch数据加载器示例,以及TerraTorch框架的示例配置,方便用户根据自己的需求进行数据加载和预处理。数据集还提供了标准化值,以便用户在进行模型训练时对数据进行标准化处理。
背景与挑战
背景概述
SSL4EO-S12 v1.1数据集是SSL4EO-S12的更新版本,旨在为地球观测领域提供大规模的多模态、多季节预训练数据集。该数据集由Blumenstiel等人于2025年创建,并已在arXiv上发布相关技术报告。该数据集包含来自不同模态(S2L1C、S2L2A、S1GRD和S2RGB)的246,144个位置,每个位置具有四个时间戳,总计约976,576个样本。SSL4EO-S12 v1.1的构建旨在促进地球观测领域自监督学习的应用,并已在相关研究中展现出其重要价值。
当前挑战
在构建SSL4EO-S12 v1.1数据集的过程中,研究人员面临了诸多挑战。首先,多模态数据的整合与标准化是一项复杂任务,需要确保不同来源和格式的数据能够有效地融合。其次,数据集的存储和加载效率也是一大挑战,为此采用了Zarr Zip文件格式以优化存储和访问。此外,数据集的多样性和季节性变化为标注和模型训练带来了额外的复杂性。研究人员还需解决如何平衡不同模态和季节的数据分布问题,以确保模型训练的泛化能力。
常用场景
经典使用场景
SSL4EO-S12 v1.1数据集是地球观测领域自监督学习的宝贵资源,其经典使用场景在于为深度学习模型提供大规模、多模态、多季节的图像时间序列,以进行预训练。通过该数据集,研究者能够训练模型捕捉不同光谱和雷达波段之间的复杂关系,以及随时间变化的土地覆盖和地形特征。
解决学术问题
该数据集解决了遥感影像分析中的多个学术问题,如如何有效融合多源数据以提高模型泛化能力,如何利用时间序列数据捕捉动态变化,以及如何进行大规模数据的存储和高效加载。其意义在于为地球系统建模提供了高质量的数据基础,对推动相关领域的研究具有重大影响。
实际应用
在实际应用中,SSL4EO-S12 v1.1数据集可用于农业监测、森林火灾预警、洪水预测等领域。通过对历史遥感数据的深入分析,模型能够辅助决策者更好地理解地球表面的变化趋势,从而做出更为精准的决策。
数据集最近研究
最新研究方向
SSL4EO-S12 v1.1数据集作为地球观测自监督学习的重要资源,近期研究主要聚焦于多模态、多季节特性的融合与应用。研究者们致力于探索其在深度学习模型预训练中的优化策略,以及如何利用该数据集提升模型在遥感图像解析任务中的性能。此外,该数据集在推动自监督学习技术在地球系统科学中的应用方面具有重要意义,为气候变化、土地覆盖变化等环境监测领域提供了新的视角和数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作