core-five
收藏core-five 数据集概述
基本信息
- 名称: core-five
- 类型: 多模态数据集
- 许可证: GPL-3.0
- 任务类别: 零样本分类、特征提取
- 语言: 英语
- 标签: 地球观测、遥感、卫星图像、Sentinel-1、Sentinel-2、MODIS、Landsat、超分辨率、基础模型、地理空间、数据立方体
数据集描述
core-five 是一个全球规模的多模态地球观测数据集,包含空间和时间对齐的数据立方体。每个数据立方体融合了五种传感器模态(Sentinel-2、Sentinel-1、MODIS、Landsat和AI生成的高分辨率RGB),用于相同的地理位置和日期,支持自监督学习、跨模态融合、时空推理和基础模型训练等任务。
数据集结构
-
核心结构:
core-five/ └── src/ └── datatree/ └── <parent_tile_id>/ └── <sub_tile_id>.nc # 1×1 km 的瓦片,位于其10×10 km的父网格内
关键特点
- 多传感器数据: 来自5种不同的卫星源
- 相同位置: 所有模态的地理位置一致
- 相同日期: 所有传感器的采集日期相同
- 完美地理对齐: 所有数据层的地理对齐
- 一致格式: 所有瓦片格式一致,易于扩展和加载
- 基础模型就绪: 适用于MAE、Perceiver IO等模型
内容详情
每个 .nc 文件包含以下内容:
s2: Sentinel-2 影像s1: Sentinel-1 VV/VH 数据modis: MODIS 波段/指数(如NDVI、LST等)landsat: Landsat 表面反射率highres: 高分辨率RGB影像(AI生成)
使用示例
python import xarray as xr tree = xr.open_datatree("core-five/src/datatree/<parent_tile_id>/<sub_tile_id>.nc") s2 = tree["s2"] # Sentinel-2 时间堆栈 s1 = tree["s1"] # Sentinel-1 SAR 堆栈 modis = tree["modis"] # MODIS 环境指标 landsat = tree["landsat"] # Landsat 堆栈 highres = tree["hr/data"] # 高分辨率RGB影像
适用场景
- 基础模型开发
- 自监督预训练
- 跨模态融合与协同训练
- 时空推理任务
- 跨地理和季节的迁移学习
- 超分辨率开发
- 云鲁棒性建模
- 地理空间检索或分类的时空嵌入
引用
@dataset{gajeshladhar_corefive_2025, author = {Gajesh Ladhar}, title = {core-five: Multi-Modal Remote Sensing Dataset}, year = {2025}, url = {https://huggingface.co/datasets/gajeshladhar/core-five} }
联系方式
- 作者: Gajesh Ladhar
- 邮箱: gajeshladhar@gmail.com
- LinkedIn: linkedin.com/in/gajeshladhar
未来计划
- 全球S2Sphere瓦片扩展
- 派生指数(EVI、NDWI、建筑指标等)
- 基础模型管道(Perceiver IO、Mask2Former、Swin-L)
- Hugging Face 示例笔记本




