SAT-MTB-VSR, CQ1-VSR

github2026-04-26 更新2026-05-01 收录

下载链接：

https://github.com/HIAS-Zhao/THGNet

下载链接

链接失效反馈

官方服务：

资源简介：

SAT-MTB-VSR是一个用于卫星视频超分辨率的大规模数据集，来源于Jilin-1的原始视频，是卫星视频多任务数据集SAT-MTB的一个子集。它包含431个视频，每个视频有100个连续帧，其中413个用于训练集，18个用于验证集。所有验证集均来自不同的原始视频，图像尺寸为640×640。这些图像通过双三次插值下采样4倍，得到160×160的低分辨率图像，从而获得LR-HR训练对。CQ1-VSR相比SAT-MAT-VSR更具挑战性，因为它由未经处理的原始遥感视频序列构建，表现出更大的帧间变化。由于原始数据以Bayer模式格式存储，我们首先将其转换为RGB图像。为了更好地模拟遥感视频中的实际退化，我们在数据预处理过程中进一步应用了噪声破坏和模糊退化。预处理后，数据集分为150个训练序列、26个验证序列和22个测试序列。每个高分辨率帧被裁剪为640×640的空间大小，并通过×4下采样生成相应的低分辨率输入，得到160×160的LR帧。

SAT-MTB-VSR is a large-scale dataset for satellite video super-resolution, derived from raw videos of Jilin-1, and it is a subset of the satellite video multi-task dataset SAT-MTB. It contains 431 videos, each with 100 consecutive frames, where 413 are assigned to the training set and 18 to the validation set. All validation set videos originate from distinct raw videos, with an image size of 640×640. These images are downsampled by a factor of 4 via bicubic interpolation to obtain 160×160 low-resolution (LR) images, thus generating LR-HR training pairs. CQ1-VSR is more challenging than SAT-MAT-VSR, as it is constructed from unprocessed raw remote sensing video sequences and exhibits greater inter-frame variation. Since the raw data is stored in Bayer pattern format, we first convert it into RGB images. To better simulate the actual degradations in remote sensing videos, we further apply noise corruption and blur degradations during the data preprocessing stage. After preprocessing, the dataset is split into 150 training sequences, 26 validation sequences, and 22 test sequences. Each high-resolution (HR) frame is cropped to a spatial size of 640×640, and then downsampled by a factor of 4 to generate corresponding low-resolution inputs, yielding 160×160 LR frames.

创建时间：

2026-04-24

原始信息汇总

THGNet 数据集详情总结

数据集概述

THGNet 项目包含两个用于卫星视频超分辨率（Satellite Video Super-Resolution）的数据集：SAT-MTB-VSR 和 CQ1-VSR。

数据集一：SAT-MTB-VSR

来源：吉林一号卫星原始视频，是卫星视频多任务数据集 SAT-MTB 的子集。
规模：共 431 个视频，每个视频包含 100 个连续帧。
划分：
- 训练集：413 个视频
- 验证集：18 个视频（均来自不同的原始视频）
图像尺寸：
- 高分辨率（HR）：640 × 640 像素
- 低分辨率（LR）：通过 4 倍双三次插值下采样得到，尺寸为 160 × 160 像素
用途：提供 LR-HR 训练对，用于卫星视频超分辨率任务。

数据集二：CQ1-VSR

特点：比 SAT-MTB-VSR 更具挑战性，由未经处理的原始遥感视频序列构建，帧间变化更大。
预处理：
- 原始数据为 Bayer 模式格式，先转换为 RGB 图像。
- 在预处理过程中添加噪声污染和模糊退化，以模拟真实的遥感视频退化。
划分：
- 训练集：150 个序列
- 验证集：26 个序列
- 测试集：22 个序列
图像尺寸：
- 高分辨率（HR）：640 × 640 像素
- 低分辨率（LR）：通过 4 倍下采样得到，尺寸为 160 × 160 像素

数据集下载与组织结构

数据集需从相应链接下载，并按照以下目录结构组织：

data/ ├── SAT-MTB-VSR/ │ ├── train/ │ │ ├── GT/ │ │ └── LR4x/ │ └── val/ ├── CQ1-VSR/ │ ├── train/ │ │ ├── GT/ │ │ └── LR4x/ │ ├── val/ │ └── test/

注意：如果实际数据集结构与此示例不同，请替换为实际文件夹名称。

说明

由于数据集和部分权重文件体积较大，将在 GitHub 上后续公开。

致谢

该项目基于 BasicSR 构建。

搜集汇总

数据集介绍

构建方式

在卫星视频超分辨率领域，构建高质量且能模拟真实退化场景的数据集是推动算法发展的关键。SAT-MTB-VSR数据集源自吉林一号卫星原始视频，是卫星视频多任务数据集SAT-MTB的子集，包含431段视频，每段100帧连续图像，其中413段作为训练集，18段作为验证集，且验证集视频均来自不同的原始视频以确保多样性。图像尺寸为640×640，通过双三次插值进行4倍下采样，得到160×160的低分辨率图像，从而形成LR-HR训练对。相比之下，CQ1-VSR更具挑战性，它由未经处理的原始遥感视频序列构建，数据以拜耳模式存储，首先被转换为RGB图像。为更真实地模拟遥感视频中的退化，在预处理过程中进一步叠加了噪声和模糊退化。数据集被划分为150个训练序列、26个验证序列和22个测试序列，每帧高分辨率图像裁剪至640×640，对应的低分辨率输入同样通过4倍下采样生成。

特点

两种数据集各具鲜明特点。SAT-MTB-VSR规模宏大，涵盖413个训练视频和18个独立验证视频，每个视频包含100帧连续图像，为模型提供了丰富的时空信息，且验证集视频均来自不同原始视频，有助于评估模型的泛化能力。其采用双三次插值下采样构建LR-HR对，退化模式较为标准。CQ1-VSR则更贴近真实场景，其数据源自未经处理的原始遥感视频，帧间差异更大，且通过人工添加噪声和模糊退化，模拟了航天成像中常见的复杂失真，使得超分辨率任务更具挑战性。此外，CQ1-VSR还提供了独立的测试集，便于全面评估模型性能。

使用方法

使用上述数据集时，需按照特定目录结构组织数据。数据集下载后，应分别放置于data/SAT-MTB-VSR和data/CQ1-VSR文件夹下，每个文件夹内包含train、val（及test）子目录，且训练集需明确分出GT（高分辨率）和LR4x（低分辨率）子文件夹。推荐的项目结构中将数据集置于THGNet/data/路径下。模型训练时，可基于BasicSR框架，通过修改options/train/目录下的YAML配置文件来指定数据集路径和超参数，使用单GPU或多GPU命令启动训练。测试时则调用对应的test配置文件。预训练权重文件需放置于experiments/pretrained_models/目录中，并按说明加载。

背景与挑战

背景概述

在遥感视频超分辨率领域，现有数据集多基于简单下采样模拟退化，难以反映真实卫星视频中复杂的时空退化与帧间变化。为此，研究人员于近期构建了SAT-MTB-VSR与CQ1-VSR两个视频超分辨率数据集，分别源自吉林一号卫星的多任务子集与未经处理的原始遥感视频序列。SAT-MTB-VSR包含431段各100帧的视频，其中413段用于训练，18段用于验证；CQ1-VSR则包含150个训练序列、26个验证序列和22个测试序列，并引入噪声与模糊退化以模拟真实场景。这两个数据集为卫星视频超分辨率研究提供了大规模、高挑战性的基准，推动了该领域从理想退化向真实退化的转变。

当前挑战

SAT-MTB-VSR与CQ1-VSR所面临的挑战主要体现在两个方面：首先，在领域问题上，卫星视频超分辨率需同时应对低空间分辨率、传感器噪声、大气扰动以及帧间大范围运动带来的复杂退化，现有方法难以在时空一致性与细节重建之间取得平衡；其次，在数据集构建过程中，CQ1-VSR需从Bayer格式原始数据转换并叠加噪声与模糊，如何准确模拟真实退化而不引入人工伪影是一大难题；同时，确保不同视频片段之间场景多样性及退化分布的合理性，也对数据预处理与验证集划分提出了严格要求。

常用场景

经典使用场景

在遥感视频超分辨率研究领域，SAT-MTB-VSR与CQ1-VSR数据集主要用于训练和评估从低分辨率卫星视频帧重建高分辨率图像的视频超分辨率模型。经典使用场景包括以4倍下采样方式构建低分辨率与高分辨率图像对，并依托THGNet等深度学习架构，验证模型在连续帧间信息提取与时空特征融合上的表现。研究者常利用这些数据集进行定量与定性评估，结合峰值信噪比和结构相似性等指标，检验模型在面对不同退化类型及帧间变化时的重建能力。

解决学术问题

这两个数据集解决了遥感视频超分辨率研究中长期存在的两大核心难题：缺乏大规模且真实退化的标准基准数据，以及难以有效处理卫星视频中因平台运动、传感器噪声和大气扰动引起的帧间大变化。通过提供包含413个训练视频与18个验证视频的SAT-MTB-VSR，以及随机噪声和模糊退化的CQ1-VSR，学术界得以在更贴近实际的数据条件下评估算法鲁棒性。这极大推动了从传统单帧超分到视频时序超分的范式转换，并为遥感信息提取和高精度地图构建等下游任务提供了可靠支撑。

衍生相关工作

围绕这两个数据集，衍生出了一系列具有代表性的研究工作。其中THGNet作为基线方法被广泛引用，其特点在于融合时序掩码自编码器与分层门控机制以捕获帧间长程依赖。后续工作多在此基础上改进退化建模，例如引入光学传递函数模拟真实光路，或结合生成对抗网络提升纹理真实性。同时，这些数据还催生了关于跨数据集泛化性能的评测基准，以及面向全色和多光谱视频的联合超分框架，促使遥感视频重建与目标检测、变化检测等任务形成多任务学习闭环。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集