five

nasa-cisto-data-science-group/satvision-pretrain-small

收藏
Hugging Face2023-08-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nasa-cisto-data-science-group/satvision-pretrain-small
下载链接
链接失效反馈
官方服务:
资源简介:
Satvision Pretraining Dataset - Small数据集由NASA GSFC CISTO Data Science Group开发,用于预训练视觉变换器模型。该数据集通过webdatasets构建,以减少在HPC系统中使用的inode数量。每个文件包含100000个图块,每个图块包含图像输入和注释对。数据集进一步压缩以便于从HuggingFace下载。预训练模型基于SwinV2架构,使用MODIS表面反射数据,采用掩码图像建模(MIM)对比预训练策略进行训练。预训练数据的分辨率为128x128,窗口大小为16x16,模型在8x A100 GPU和12x V100 GPU上进行了800个epoch的预训练。
提供机构:
nasa-cisto-data-science-group
原始信息汇总

数据集概述

数据集名称

  • 名称: Satvision Pretraining Dataset - Small

开发机构

  • 开发机构: NASA GSFC CISTO Data Science Group

数据集类型

  • 类型: 预训练视觉Transformer模型数据集

许可证

  • 许可证: Apache license 2.0

数据集结构

  • 文件结构: 每个文件包含100000个瓦片,每对瓦片包含图像输入和注释。
  • 压缩方式: 数据进一步压缩以简化从HuggingFace的下载。

预训练模型详情

  • 模型名称: SatVision-Base (SatVis-B)
  • 模型架构: 基于SwinV2模式架构的预训练视觉Transformer
  • 预训练数据: 全球MODIS表面反射率数据,使用1.99百万图像瓦片
  • 预训练策略: 使用掩码图像建模(MIM)对比预训练策略
  • 预训练细节: 分辨率为128x128,窗口大小为16x16,预训练800个周期,使用8x A100 GPUs和12x V100 GPUs

预训练模型参数

名称 预训练周期 预训练分辨率 参数数量 预训练模型
SatVision-Base 800 128x128 84.5m checkpoint/config

预训练数据集详情

名称 波段 分辨率 瓦片数量 每像素米数
MODIS-Small 7 128x128 1,994,131 500m
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作