five

ben-ge

收藏
github2023-12-22 更新2024-05-31 收录
下载链接:
https://github.com/HSG-AIML/ben-ge
下载链接
链接失效反馈
官方服务:
资源简介:
ben-ge是一个多模态地球观测数据集,作为BigEarthNet数据集的扩展,提供了额外的地理和环境数据,包括高程数据、土地利用/覆盖数据、环境数据和气候区信息等。该数据集旨在为地球观测应用提供丰富的数据模态,支持模型训练和预训练,以及数据融合、多任务学习和自监督学习等概念的实验。

The ben-ge dataset is a multimodal Earth observation dataset, serving as an extension of the BigEarthNet dataset. It provides additional geographical and environmental data, including elevation data, land use/cover data, environmental data, and climate zone information. This dataset aims to offer a rich variety of data modalities for Earth observation applications, supporting model training and pre-training, as well as experiments in data fusion, multi-task learning, and self-supervised learning concepts.
创建时间:
2023-05-30
原始信息汇总

数据集概述

ben-ge 是一个多模态地球观测数据集,作为 BigEarthNet 数据集的扩展。BigEarthNet 数据集包含欧洲590,326个地点的Sentinel-1和Sentinel-2观测数据。ben-ge 为每个观测点提供了以下额外数据:

  • 从Copernicus数字高程模型GLO-30提取的海拔数据;
  • 从ESA WorldCover提取的土地利用/土地覆盖数据;
  • 与Sentinel-1/2观测同时的环境数据,来自ERA-5全球再分析;
  • 从Beck et al. 2018提取的气候带信息;
  • 季节编码。

数据下载

ben-ge 数据托管在zenodo,用户可以从该平台下载不同模态的数据。除了完整数据集外,还提供了一个小型版本 ben-ge-8k,用于代码实现和快速实验。

完整数据集

完整 ben-ge 数据集包含590,326个补丁的多模态数据。数据集以模块化方式提供,用户可以选择感兴趣的数据模态:

  • Sentinel-2: 多波段图像数据,参考BigEarthNet下载网站
  • Sentinel-1: 合成孔径雷达(SAR)极化数据,参考BigEarthNet下载网站
  • 数字高程模型数据,下载链接:这里 [2.5 GB打包]。
  • 土地利用/土地覆盖数据,下载链接:这里 [487 MB打包]。
  • 环境数据,下载链接:这里 [18 MB打包]。
  • 气候带数据,包含在ben-ge元数据文件中,下载链接:这里 (87 MB)。
  • 季节编码,包含在ben-ge元数据文件中,下载链接:这里 (87 MB)。

解压后,整个 ben-ge 数据集(包括BigEarthNet Sentinel-1/2数据)总计191 GB。

数据集分割

提供不同类型的分割,每个子集包含完整数据集的一定百分比:

标识符 百分比 样本大小
ben-ge-0.2 20% 118k
ben-ge-0.4 40% 236k
ben-ge-0.6 60% 354k
ben-ge-0.8 80% 472k

每个子集都带有固定的训练/验证/测试分割(80/10/10)。

ben-ge-8k: 小型版本

ben-ge-8k 提供了一个小型版本的 ben-ge,所有模态(包括BigEarthNet的Sentinel-1和Sentinel-2及其对应的标签文件)都包含在一个可下载的归档文件中,解压后需要4.2 GB空间。

引用 ben-ge

使用 ben-ge 或其衍生品时,请确保适当引用以下出版物:

  • 使用 ben-ge 特定数据模态:

    M. Mommert, N. Kesseli, J. Hanna, L. Scheibenreif, D. Borth, B. Demir, "ben-ge: Extending BigEarthNet with Geographical and Environmental Data", IEEE International Geoscience and Remote Sensing Symposium, Pasadena, USA, 2023. 
    
  • 使用Sentinel-2数据:

    G. Sumbul, M. Charfuelan, B. Demir, V. Markl, "BigEarthNet: A Large-Scale Benchmark Archive for Remote Sensing Image Understanding", IEEE International Geoscience and Remote Sensing Symposium, pp. 5901-5904, Yokohama, Japan, 2019.
    
  • 使用Sentinel-1数据:

    G. Sumbul, A. d. Wall, T. Kreuziger, F. Marcelino, H. Costa, P. Benevides, M. Caetano, B. Demir, V. Markl, "BigEarthNet-MM: A Large Scale Multi-Modal Multi-Label Benchmark Archive for Remote Sensing Image Classification and Retrieval", IEEE Geoscience and Remote Sensing Magazine, 2021, doi: 10.1109/MGRS.2021.3089174.
    
搜集汇总
数据集介绍
main_image_url
构建方式
ben-ge数据集作为BigEarthNet的扩展,通过整合多源地理与环境数据构建而成。其核心数据来源于欧洲590,326个地点的Sentinel-1和Sentinel-2观测数据,并在此基础上补充了Copernicus数字高程模型(GLO-30)的高程数据、ESA WorldCover的土地利用/土地覆盖数据、ERA-5全球再分析的环境数据、Beck等人(2018)的气候区数据以及季节性编码。这些数据通过统一的坐标框架和插值方法进行对齐与整合,确保了多模态数据的一致性。
特点
ben-ge数据集以其多模态特性著称,涵盖了遥感影像、高程、土地利用、环境参数及气候区等多维度信息。其数据规模庞大,包含590,326个地点的完整数据,总容量达191GB。此外,数据集提供了模块化下载选项,用户可根据需求选择特定数据模态。ben-ge还提供了不同比例的子集(如20%、40%等)以及固定训练/验证/测试划分,便于不同规模的研究与应用。其小规模版本ben-ge-8k则专为快速实验与代码实现设计,仅需4.2GB存储空间。
使用方法
ben-ge数据集的使用方法灵活多样,用户可通过Zenodo平台下载所需数据模态。数据集以模块化形式提供,支持单独下载Sentinel-2多波段影像、Sentinel-1合成孔径雷达数据、数字高程模型、土地利用数据、环境数据及气候区信息。此外,ben-ge提供了预定义的子集划分和训练/验证/测试索引文件,便于直接应用于深度学习模型的训练与评估。用户还可通过Python和PyTorch代码库高效访问与处理数据,未来将提供预训练模型以支持更广泛的研究与应用。
背景与挑战
背景概述
ben-ge数据集是BigEarthNet的扩展版本,专注于地球观测领域,由M. Mommert、N. Kesseli等研究人员于2023年发布。该数据集在BigEarthNet的基础上,整合了Sentinel-1和Sentinel-2的观测数据,并进一步补充了来自Copernicus数字高程模型、ESA WorldCover土地利用/覆盖数据、ERA-5环境数据以及Beck等人提出的气候区信息等多模态数据。ben-ge的创建旨在为地球观测应用提供一个包含丰富数据模态的资源,支持数据融合、多任务学习和自监督学习等前沿研究。该数据集的研究背景源于对多源数据融合的需求,特别是在遥感图像理解、气候变化监测和土地利用分析等领域具有重要影响力。
当前挑战
ben-ge数据集在解决地球观测领域的多模态数据融合问题时面临诸多挑战。首先,数据来源的多样性和复杂性使得数据对齐和标准化成为关键难题,尤其是在不同传感器(如Sentinel-1和Sentinel-2)和时间分辨率的数据整合过程中。其次,数据规模庞大(约191GB),对存储、计算资源和数据处理效率提出了较高要求。此外,构建过程中需要处理来自不同数据源的时空一致性、分辨率差异以及数据缺失等问题,这对数据预处理和插值技术提出了挑战。最后,如何有效利用多模态数据进行模型训练和验证,尤其是在多任务学习和自监督学习场景下,仍需进一步探索和优化。
常用场景
经典使用场景
ben-ge数据集在地球观测领域具有广泛的应用,特别是在多模态数据融合和深度学习模型的训练与预训练中。该数据集通过整合Sentinel-1和Sentinel-2的遥感数据,并结合高程、土地利用/覆盖、环境数据以及气候区信息,为研究者提供了一个全面的多模态数据平台。其经典使用场景包括土地利用分类、气候变化监测、自然灾害评估等,尤其适合用于多任务学习和自监督学习的研究。
实际应用
在实际应用中,ben-ge数据集被广泛用于土地利用规划、环境监测和灾害管理等领域。例如,通过分析土地利用/覆盖数据,城市规划者可以优化土地资源配置;结合环境数据,气象学家能够更准确地预测气候变化;而高程数据则为自然灾害风险评估提供了重要依据。此外,该数据集还被用于农业监测和森林管理,帮助决策者制定科学的资源管理策略。
衍生相关工作
ben-ge数据集的发布催生了一系列相关研究工作,特别是在多模态数据融合和深度学习模型优化方面。例如,基于该数据集的研究提出了新的多任务学习框架,能够同时处理遥感图像分类和环境参数预测任务。此外,一些研究利用ben-ge数据集开发了自监督学习方法,显著提升了模型在有限标注数据下的性能。这些工作不仅推动了地球观测领域的技术进步,也为其他多模态数据集的研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作