GeoSR-Bench

Hugging Face2026-05-20 更新2026-05-21 收录

下载链接：

https://huggingface.co/datasets/ai-spatial/GeoSR-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

GeoSR-Bench 是一个专门设计用于连接遥感图像超分辨率与下游地球监测任务的基准数据集。它超越了传统的基于图像保真度的评估范式，旨在系统性地探究超分辨率模型所提升的图像分辨率是否能够切实改善下游实际应用任务的性能。数据集包含来自全球约 36,000 个不同地理位置、覆盖多种土地覆盖类型的图像对。这些图像对在空间上共置、时间上对齐，并经过严格的质量控制，空间分辨率范围覆盖从 500 米到 0.6 米。数据集的核心围绕两个跨平台的超分辨率任务构建：1) 从 MODIS 数据超分辨率至 Landsat-8 级别；2) 从 Sentinel-2 数据超分辨率至 NAIP 级别。针对每个任务，数据集进一步细分为两种类型的子集：仅超分辨率数据集和下游任务数据集。仅超分辨率数据集包含配对的低分辨率与高分辨率遥感图像，不包含下游任务标签，主要用于训练超分辨率模型；下游任务数据集除了配对的图像对，还包含任务特定的标签，用于在微调超分辨率模型后，评估超分后的图像在土地覆盖分割、基础设施制图、生物物理变量估计等具体地球监测任务上的性能提升。每个数据样本通常包括低分辨率输入图像、高分辨率参考图像，以及在下游任务数据集中对应的任务标签（如图像分割掩膜）。所有图像和标签均以保留完整地理空间元数据（如坐标系、几何变换、分辨率）的 GeoTIFF 格式存储。数据集的划分信息通过 CSV 文件管理，其中明确标注了每条数据用于训练、验证还是测试。GeoSR-Bench 适用于推动遥感图像超分辨率、任务感知的图像复原、跨平台学习以及地理空间基础模型等领域的研究。

GeoSR-Bench is a benchmark dataset specifically designed to connect remote sensing image super-resolution with downstream Earth monitoring tasks. It goes beyond traditional image fidelity-based evaluation paradigms, aiming to systematically investigate whether the enhanced image resolution from super-resolution models can genuinely improve the performance of downstream practical applications. The dataset contains approximately 36,000 image pairs from different geographic locations worldwide, covering various land cover types. These image pairs are spatially co-located, temporally aligned, and undergo rigorous quality control, with spatial resolutions ranging from 500 meters to 0.6 meters. The core of the dataset is built around two cross-platform super-resolution tasks: 1) super-resolution from MODIS data to Landsat-8 level; and 2) super-resolution from Sentinel-2 data to NAIP level. For each task, the dataset is further divided into two types of subsets: super-resolution-only dataset and downstream task dataset. The super-resolution-only dataset includes paired low-resolution and high-resolution remote sensing images without downstream task labels, primarily used for training super-resolution models; the downstream task dataset, in addition to paired image pairs, includes task-specific labels for evaluating the performance improvement of super-resolved images in specific Earth monitoring tasks such as land cover segmentation, infrastructure mapping, and biophysical variable estimation after fine-tuning super-resolution models. Each data sample typically includes a low-resolution input image, a high-resolution reference image, and corresponding task labels (e.g., image segmentation masks) in the downstream task dataset. All images and labels are stored in GeoTIFF format, preserving complete geospatial metadata (such as coordinate systems, geometric transformations, and resolution). The datasets division information is managed through CSV files, which clearly indicate whether each data entry is used for training, validation, or testing. GeoSR-Bench is suitable for advancing research in areas such as remote sensing image super-resolution, task-aware image restoration, cross-platform learning, and geospatial foundation models.

创建时间：

2026-05-14

原始信息汇总

GeoSR-Bench 数据集概述

基本信息

许可证: CC-BY-4.0
语言: 英语
任务类别: 图像到图像（image-to-image）、图像分割（image-segmentation）
数据规模: 10,000 < 样本数 < 100,000
数据集全称: GeoSR-Bench
数据状态: 正在上传和整理中（部分文件、元数据和子集可能不完整或有所变动）

数据集描述

GeoSR-Bench 旨在将超分辨率（Super-Resolution, SR）与下游地球监测任务直接关联，超越传统的基于保真度的评估。该数据集包含来自约36,000个地点的空间共位、时间对齐且经过质量控制的图像对，覆盖多种土地覆盖类型，空间分辨率从500米到0.6米不等。其设计目标是评估超分辨率模型提升图像分辨率后，能否在地表覆盖分割、基础设施映射和生物物理变量估计等下游任务中带来性能提升。

跨平台超分辨率任务

数据集包含两个跨平台超分辨率任务：

MODIS → Landsat-8：从MODIS图像提升至Landsat-8分辨率
Sentinel-2 → NAIP：从Sentinel-2图像提升至NAIP分辨率

子集类型

每个任务的组织包含两类子集：

纯超分辨率数据集（SR-only datasets）：包含配对的低分辨率和高分辨率遥感图像，无下游任务标签，用于训练超分辨率模型。
下游任务数据集（Downstream task datasets）：包含配对的高低分辨率图像以及任务特定的标签，用于微调超分辨率模型，并评估超分辨图像是否改善下游地球监测任务（如地表覆盖分割、基础设施映射、生物物理变量估计）。

样本内容

每个样本可能包含：

低分辨率图像（lower-resolution image）
高分辨率参考图像（higher-resolution reference image）
下游任务标签（downstream task label，如适用）
元数据（metadata，如适用）

文件夹结构

纯超分辨率数据集结构

SRDatasetName/ ├── lr/ 或 modis/ 或 s2/ │ ├── lr_0.tif │ ├── lr_1.tif │ └── ... ├── hr/ 或 l8/ 或 naip/ │ ├── hr_0.tif │ ├── hr_1.tif │ └── ... ├── meta/ │ ├── meta_0.json │ ├── meta_1.json │ └── ... └── SRDatasetName_split_all.csv

下游任务数据集结构

DownstreamDatasetName/ ├── s2/ 或 modis/ │ ├── s2_0.tif │ ├── s2_1.tif │ └── ... ├── naip/ 或 l8/ │ ├── naip_0.tif │ ├── naip_1.tif │ └── ... ├── label/ │ ├── label_0.tif │ ├── label_1.tif │ └── ... ├── meta/ │ ├── meta_0.json │ ├── meta_1.json │ └── ... └── DownstreamDatasetName_split_all.csv

划分文件

每个子集包含一个CSV文件，描述图像路径和数据划分：

纯超分辨率数据集：用于训练超分辨率模型，无预定义的训练/验证/测试划分
下游任务数据集：CSV文件包含以下列：

列名	描述
`LR image`	低分辨率输入图像路径
`HR image`	高分辨率参考图像路径
`Label`	下游任务标签路径
`split`	数据集划分：`training`、`validation` 或 `test`

文件格式

图像：存储为GeoTIFF文件（.tif）
标签：存储为GeoTIFF文件（.tif）
元数据：可用时存储为JSON文件（.json）
划分文件：存储为CSV文件（.csv）

GeoTIFF文件保留了地理空间元数据，如坐标参考系统、变换参数、分辨率和空间范围。

预期用途

该数据集适用于以下研究领域：

遥感图像超分辨率
下游任务感知的图像恢复
地表覆盖制图
基础设施映射
生物物理变量估计
跨平台地球观测学习
地理基础模型（Geo-foundation models）

引用信息

bibtex @article{li2026beyond, title={Beyond Visual Fidelity: Benchmarking Super-Resolution Models for Large-Scale Remote Sensing Imagery via Downstream Task Integration}, author={Li, Zhili and Chai, Kangyang and Wang, Zhihao and Jia, Xiaowei and Li, Yanhua and Mai, Gengchen and Skakun, Sergii and Manocha, Dinesh and Xie, Yiqun}, journal={arXiv preprint arXiv:2605.00310}, year={2026} }

搜集汇总

数据集介绍

构建方式

GeoSR-Bench通过精心构建空间共位、时间对齐且经质量控制的影像对，建立了超分辨率与地球监测下游任务之间的直接桥梁。数据集涵盖约36,000个地点，覆盖多样土地覆盖类型，空间分辨率跨越从500米至0.6米的广阔范围。其构建包含两种跨平台超分辨率任务：MODIS至Landsat-8以及Sentinel-2至NAIP。针对每项任务，数据集划分为仅含超分辨率影像对的子集，用于模型训练，以及附带任务标签的下游任务子集，用于模型微调与评估。所有影像以GeoTIFF格式存储，保留地理空间元数据，确保数据的一致性与可用性。

使用方法

GeoSR-Bench的使用方法简洁高效，研究者可通过Python读取CSV分割文件，快速获取影像路径与数据集划分信息。对于仅超分辨率子集，利用'LR image'和'HR image'列加载输入与参考影像；对于下游任务子集，则额外使用'Label'列加载任务标签。GeoTIFF文件可通过rasterio库读取，获取影像数组、坐标系及变换参数。数据集支持训练超分辨率模型、微调下游任务模型，以及评估超分辨率影像对土地覆盖分类、基础设施检测等任务的实际提升效果，为跨平台地球观测学习与地理基础模型研究提供标准化基准。

背景与挑战

背景概述

GeoSR-Bench是由Zhili Li、Kangyang Chai、Zhihao Wang等研究人员于2026年构建的遥感超分辨率基准数据集，旨在突破传统图像超分辨率任务仅关注像素级保真度的局限。该数据集直接连接超分辨率与下游地球监测任务，涵盖从500米至0.6米空间分辨率的跨平台影像对，涉及MODIS到Landsat-8、Sentinel-2到NAIP两种核心任务，包含约36,000个覆盖多样化土地覆盖类型的位置。通过提供超分辨率训练子集和配备语义分割、基础设施映射及生物物理变量估计标签的下游任务子集，GeoSR-Bench推动了任务感知型超分辨率、跨平台学习与遥感基础模型研究的发展，在遥感与计算机视觉交叉领域具有重要的影响力。

当前挑战

GeoSR-Bench面临的核心领域挑战在于：传统超分辨率模型以峰值信噪比等保真度指标为优化目标，却无法保证提升后的图像分辨率能有效改善土地覆盖分类、基础设施提取等下游地球监测任务的性能，导致超分辨率研究与实际应用之间存在鸿沟。在构建过程中，该数据集面临多重挑战：首先，需从全球范围筛选约36,000个空间共位、时间对齐且经过质量控制的位置，确保影像对在不同平台、不同分辨率下的精确配准；其次，跨传感器（如MODIS与Landsat-8、Sentinel-2与NAIP）的辐射定标、几何校正及数据一致性处理极为复杂；最后，为下游任务标注大规模高分辨率标签（如地物分类、基础设施边界）需要大量人工与自动化结合，成本高昂且质量难以统一。

常用场景

经典使用场景

在遥感科学与地球观测领域，图像超分辨率一直是提升空间信息解析能力的关键技术。GeoSR-Bench数据集的核心价值在于构建了一套完整的跨平台超分辨率评估框架，其经典使用场景包括从较低空间分辨率的多光谱影像（如MODIS或Sentinel-2）重建出高分辨率对应影像（如Landsat-8或NAIP），并与下游任务标签深度融合。研究人员能够利用该数据集训练超分辨率模型，并直接在下游任务（如土地覆盖分割、基础设施制图及生物物理变量估算）中验证图像恢复效果。这种端到端的评估范式突破了传统仅以峰值信噪比或结构相似性为指标的局限，使得超分辨率研究能够真正服务于地球监测的实际需求。数据集中约36000个空间对齐的位置点覆盖了多样化的土地覆盖类型，为模型泛化能力提供了坚实的实验基础。

解决学术问题

GeoSR-Bench数据集的提出解决了遥感超分辨率研究中长期存在的两大核心学术难题：一是缺乏与下游任务紧密结合的标准化评估基准，传统超分辨率方法往往仅关注视觉质量而忽视了重建图像在语义解析中的实际效用；二是跨平台遥感影像的尺度差异和地物复杂性导致模型迁移困难，亟需构建大规模、多分辨率、地理对齐的配对数据资源。该数据集通过精心设计的两类子集——超分辨率专用集和下游任务评估集，为研究者提供了从模型训练到任务验证的完整链路。其深远意义在于推动学术界从“视觉驱动”向“任务驱动”的范式跃迁，促使超分辨率研究更加关注地球观测应用的物理本质。同时，该数据集也为地理空间基础模型的预训练和微调提供了高质量的遥感影像与标签对，助力构建更具泛化能力的遥感智能解译系统。

实际应用

在实际工程应用中，GeoSR-Bench数据集为多个关键领域提供了可直接落地的解决方案。在城市规划与国土资源管理中，通过Sentinel-2到NAIP的超分辨率重建，可实现无需频繁获取昂贵航拍影像的低成本高精度基础设施制图。在农业与生态监测中，MODIS到Landsat-8的图像增强能够显著提升植被指数和作物类型的识别精度，助力精准农业和碳汇估算。对于灾害应急响应，快速提升卫星影像分辨率有助于第一时间识别建筑物损毁和洪水淹没范围。此外，该数据集支持跨平台传感器间的知识迁移，使得利用历史存档卫星数据生成现势性高分辨率地图成为可能，有效降低了地面核查的物力与人力成本。这些实际应用场景充分验证了GeoSR-Bench作为超分辨率技术从实验室走向产业界桥梁的关键作用。

数据集最近研究