Remote Sensing Change Caption (RSCC)

Name: Remote Sensing Change Caption (RSCC)
Creator: 浙江大学
Published: 2025-09-02 11:01:23
License: 暂无描述

arXiv2025-09-02 更新2025-09-05 收录

下载链接：

https://yun.com

下载链接

链接失效反馈

官方服务：

资源简介：

RSCC数据集是一个大规模的基准数据集，包含62,315对灾前灾后图像（涵盖地震、洪水、野火等事件），每对图像都配有人类风格的详细变化描述。该数据集填补了现有遥感数据集缺乏时间序列图像对和详细文本注释的空白，通过连接遥感数据中的时间和语义鸿沟，RSCC使视觉语言模型能够进行稳健的训练和评估，从而更好地理解灾害事件。数据集的构建过程包括数据来源、属性提取、提示构建、QvQ-Max推理、后修正和人工验证等步骤。RSCC数据集的应用领域包括灾害监测、分析和响应，旨在解决灾害事件中动态影响随时间变化的问题。

The RSCC dataset is a large-scale benchmark dataset containing 62,315 pairs of pre-disaster and post-disaster remote sensing images covering events such as earthquakes, floods, and wildfires. Each pair of images is accompanied by detailed human-written change descriptions. This dataset fills the gap in existing remote sensing datasets that lack paired time-series images and detailed textual annotations. By bridging the temporal and semantic gaps in remote sensing data, the RSCC dataset enables robust training and evaluation of vision-language models, allowing them to better understand disaster events. The construction process of the RSCC dataset includes steps such as data sourcing, attribute extraction, prompt engineering, QvQ-Max inference, post-correction, and manual verification. The application scenarios of the RSCC dataset cover disaster monitoring, analysis, and response, aiming to address the issue of dynamically changing impacts of disaster events over time.

提供机构：

浙江大学

创建时间：

2025-09-02

搜集汇总

数据集介绍

构建方式

RSCC数据集通过多模态推理模型QvQ-Max结合人工标注构建，整合了xBD和EBD两大灾害遥感数据源的62,315对双时相图像。采用结构化提示工程将建筑损伤标签转化为上下文辅助信息，通过视觉标注后灾图像与文本指令的协同输入，生成新闻风格的灾害变化描述。经过两阶段后修正流程，包括元数据对齐自动化校正与专家人工验证，确保描述与灾害类型、损伤等级的精确一致性，最终达成92.3%的样本通过率与89.3的评分者间一致性。

特点

该数据集涵盖地震、洪水、野火等31类全球灾害事件，提供高分辨率512×像素的双时相图像对与平均72词长度的精细化文本描述。其独特价值在于融合灾害感知的时空语义信息，包括建筑损伤量化统计与灾害等级标注，支持从宏观场景变化到微观结构损毁的多粒度分析。数据分布呈现地理多样性、灾害类型均衡性与损伤程度连续性，为模型理解灾害动态提供丰富语义支撑。

使用方法

RSCC专为视觉-语言模型的双时相遥感理解设计，提供标准化训练测试划分：训练集含61,327对图像覆盖全灾害类型，测试集988对用于性能评估。支持零样本提示、文本提示与视觉提示三种推理模式，可结合建筑损伤掩码增强变化感知能力。评估指标融合ROUGE、METEOR等传统度量与基于Sentence-T5的语义相似度计算，兼顾表面匹配与深层语义一致性。数据集支持全参数微调与提示工程优化，适用于灾害响应、环境监测等视觉-语言交叉应用。

背景与挑战

背景概述

遥感技术在灾害监测领域具有不可替代的重要价值，然而传统数据集多聚焦于单时相影像分析，难以捕捉灾害事件的动态演变过程。2025年，浙江大学研究团队发布了遥感变化描述数据集RSCC，该数据集包含62,315对灾害前后影像对，覆盖地震、洪水、野火等31类灾害事件，并配以精细的人工级文本描述。RSCC通过融合时空维度与语义信息，为双时相遥感理解提供了首个大规模基准，显著推动了多模态大语言模型在灾害感知领域的应用与发展。

当前挑战

RSCC致力于解决遥感变化描述任务中的核心挑战：一是灾害场景下复杂时空关系的语义化解析，需准确捕捉建筑损毁、地貌变迁等细微变化；二是数据构建过程中面临的多模态对齐难题，包括视觉信息与文本描述的精确映射、灾害等级的一致性标注，以及基于QvQ-Max模型生成描述时的幻觉抑制问题。此外，数据需克服灾害事件地理分布多样性、影像分辨率异构性，以及自动化标注与人工验证间的协同优化挑战。

常用场景

经典使用场景

在遥感灾害监测领域，RSCC数据集通过提供成对的灾前与灾后高分辨率卫星图像及精细化文本描述，为双时相视觉-语言模型训练与评估建立了标准范式。其典型应用场景包括模型在洪水、地震、野火等灾害事件中的变化检测与语义描述生成，例如通过对比图像对自动识别建筑物淹没、植被烧毁等动态变化，并输出人类可读的灾害影响报告。

衍生相关工作

基于RSCC数据集，研究者开发了多种专用模型与基准方法，如采用差异感知集成机制的CCExpert模型、融合时序编码器的TEOChat框架，以及基于扩散模型的Diffusion-RSCC方法。这些工作显著提升了模型在长时序变化 captioning 任务中的性能，并推动了如GeoLLaVA等跨领域适应性研究的发展，进一步拓展了多模态模型在遥感动态分析中的潜力。

数据集最近研究