MMEarth|卫星数据数据集|地理空间学习数据集

收藏
github2024-05-08 更新2024-05-31 收录
卫星数据
地理空间学习
下载链接:
https://github.com/vishalned/MMEarth-data
下载链接
链接失效反馈
资源简介:
MMEarth数据集包含从不同传感器和卫星(如Sentinel-2、Sentinel-1、ERA5 - 温度与降水、Aster GDEM等)下载的大规模卫星数据,这些数据被称为模态。数据通过Google Earth Engine下载,用于探索多模态预训练任务在地理空间表示学习中的应用。

The MMEarth dataset encompasses extensive satellite data, referred to as modalities, downloaded from various sensors and satellites such as Sentinel-2, Sentinel-1, ERA5 - temperature and precipitation, Aster GDEM, among others. These data are acquired through Google Earth Engine and are utilized to explore the applications of multimodal pretraining tasks in geospatial representation learning.
创建时间:
2024-03-25
原始信息汇总

数据集概述

数据集名称

  • MMEarth

数据集内容

  • 数据来源:Google Earth Engine
  • 数据类型:卫星数据
  • 传感器/卫星:Sentinel-2, Sentinel-1, ERA5 (温度 & 降水), Aster GDEM等
  • 数据下载方式:使用提供的脚本下载

数据集版本

  • 当前状态:数据集正在维护中,预计将发布Version 001。

数据集结构

  • 主要数据集

    • 名称:MMEarth
    • 图像尺寸:128x128
    • 瓷砖数量:1.2M
    • 数据集大小:639GB
    • 下载链接下载链接
    • Bash脚本bash脚本
  • 其他数据集

    • 名称:MMEarth64

    • 图像尺寸:64x64

    • 瓷砖数量:1.2M

    • 数据集大小:163GB

    • 下载链接下载链接

    • Bash脚本bash脚本

    • 名称:MMEarth100k

    • 图像尺寸:128x128

    • 瓷砖数量:100k

    • 数据集大小:48GB

    • 下载链接下载链接

    • Bash脚本bash脚本

数据集使用

  • 数据加载:提供了一个使用PyTorch加载数据的示例Jupyter Notebook。
  • 数据下载与处理
    • 创建瓷砖:使用create_tiles_polygon.pyconfig/config_tiles.yaml配置文件。
    • 下载数据堆栈:使用main_download.pyconfig/config_data.yaml配置文件。
    • 后处理:使用post_download.py进行数据合并、转换和统计计算。
    • 重新下载:使用redownload.py重新下载失败的数据瓷砖。

数据集许可证

  • 许可证:CC BY 4.0

数据集引用

  • 论文:MMEarth: Exploring Multi-Modal Pretext Tasks For Geospatial Representation Learning
  • 作者:Vishal Nedungadi, Ankit Kariryaa, Stefan Oehmcke, Serge Belongie, Christian Igel, & Nico Lang
  • 年份:2024
  • arXiv链接arXiv链接

数据集下载与执行

  • 下载工具:使用SLURM进行并行处理加速数据下载。
  • 执行命令sbatch slurm_scripts/slurm_download_parallel.sh

以上信息总结了MMEarth数据集的关键细节,包括数据集的结构、内容、下载和使用方法,以及相关的许可证和引用信息。

AI搜集汇总
数据集介绍
main_image_url
构建方式
MMEarth数据集的构建基于Google Earth Engine平台,通过整合来自不同卫星和传感器(如Sentinel-2、Sentinel-1、ERA5等)的多模态数据。数据集的构建过程包括从Google Earth Engine下载大规模卫星数据,并将其处理为包含多种模态的统一格式。具体步骤包括创建地理区域(tiles)、下载各模态数据、后处理以合并和统计数据,以及在必要时重新下载缺失的数据。
特点
MMEarth数据集的显著特点在于其多模态数据的整合,涵盖了从光学影像到气象数据等多种类型的地球观测信息。数据集提供了不同分辨率和规模的子集(如MMEarth、MMEarth64和MMEarth100k),以适应不同的研究需求。此外,数据集的结构设计便于数据加载和处理,支持PyTorch等深度学习框架的使用。
使用方法
使用MMEarth数据集时,用户首先需通过提供的脚本下载数据,并确保安装了必要的依赖包。数据集的加载可通过PyTorch的DataLoader实现,示例代码和Jupyter Notebook提供了详细的操作指南。为了高效处理大规模数据,数据集支持使用SLURM进行并行下载和处理。用户可根据研究需求选择合适的数据子集,并参考提供的配置文件进行定制化设置。
背景与挑战
背景概述
MMEarth数据集,由Vishal Nedungadi等人于2024年创建,旨在探索多模态前置任务在地理空间表示学习中的应用。该数据集整合了来自不同卫星传感器(如Sentinel-2、Sentinel-1、ERA5等)的大规模卫星数据,涵盖温度、降水、地形等多种模态。MMEarth的开发不仅推动了地理空间数据的多模态融合研究,还为相关领域的模型训练提供了丰富的数据资源。其核心研究问题在于如何有效整合和利用多源地理空间数据,以提升模型的泛化能力和预测精度。该数据集的发布对地理信息系统、遥感技术及环境科学等领域产生了深远影响。
当前挑战
MMEarth数据集在构建过程中面临多重挑战。首先,整合来自不同传感器和卫星的数据需要解决数据格式、分辨率和时间同步等问题。其次,大规模数据的下载和处理对计算资源和存储空间提出了高要求。此外,数据的去重和质量控制也是一大挑战,确保数据的准确性和一致性对于后续研究至关重要。最后,多模态数据的融合和表示学习方法的探索,需要创新的技术和算法支持,以实现高效且准确的地理空间信息提取。
常用场景
经典使用场景
MMEarth数据集在地理空间表示学习领域中具有广泛的应用。其经典使用场景包括多模态预训练任务的探索,通过整合来自不同卫星传感器(如Sentinel-2、Sentinel-1、ERA5等)的数据,研究人员可以构建复杂的模型,以提高地理空间数据的表示能力。这些模型在土地利用分类、气候变化监测和灾害预测等任务中表现出色。
衍生相关工作
MMEarth数据集的发布催生了多项相关研究工作。例如,基于该数据集的预训练模型在多个地理空间任务中取得了显著成果,推动了多模态学习在地理信息系统(GIS)中的应用。此外,MMEarth还被集成到TorchGeo框架中,进一步促进了地理空间数据处理的自动化和标准化。
数据集最近研究
最新研究方向
在地球观测与遥感领域,MMEarth数据集的最新研究方向主要集中在多模态预训练任务的探索上。该数据集整合了来自不同卫星传感器(如Sentinel-2、Sentinel-1、ERA5等)的多模态数据,为地理空间表示学习提供了丰富的资源。研究者们正利用这些多模态数据进行深度学习模型的预训练,以提升其在地理信息提取、气候变化监测和环境评估等任务中的表现。此外,MMEarth数据集的引入也促进了跨模态数据融合技术的研究,推动了地球科学领域的前沿发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集