RSFAKE-1M

Name: RSFAKE-1M
Creator: 武汉大学遥感与信息工程学院
Published: 2025-05-29 17:30:46
License: 暂无描述

arXiv2025-05-29 更新2025-05-31 收录

下载链接：

https://huggingface.co/datasets/TZHSW/RSFAKE/

下载链接

链接失效反馈

官方服务：

资源简介：

RSFAKE-1M是一个大规模的遥感图像数据集，包含50万张伪造图像和50万张真实遥感图像，用于检测基于扩散模型生成的伪造遥感图像。数据集中的伪造图像由10个在遥感数据上训练或微调的扩散模型生成，支持6种生成条件，包括文本提示、结构引导和修复等。此外，数据集还包括从fMoW数据集中采集的50万张真实图像，以支持平衡和公平的评价。RSFAKE-1M旨在促进遥感图像伪造检测领域的研究和模型开发。

RSFAKE-1M is a large-scale remote sensing image dataset comprising 500,000 forged remote sensing images and 500,000 authentic ones, which is specifically designed for detecting forged remote sensing images generated by diffusion models. The forged images in the dataset are generated by 10 diffusion models trained or fine-tuned on remote sensing data, and support 6 generation conditions including text prompts, structure guidance, inpainting and other scenarios. Additionally, the 500,000 authentic images are collected from the fMoW dataset to enable balanced and fair evaluation. RSFAKE-1M aims to facilitate research and model development in the field of remote sensing image forgery detection.

提供机构：

武汉大学遥感与信息工程学院

创建时间：

2025-05-29

搜集汇总

数据集介绍

构建方式

RSFAKE-1M数据集的构建采用了多路径生成策略，通过10种基于扩散模型的生成器合成50万张伪造遥感图像。这些生成器经过遥感数据微调，覆盖文本提示、结构引导和修复等六种生成条件。真实图像则从fMoW数据集中精选50万张，通过结构化采样策略确保与伪造图像在分辨率和分布上匹配。数据集采用60%/20%/20%的标准划分比例，为遥感伪造检测研究提供了规模与多样性并重的基准资源。

使用方法

研究者可通过分层抽样策略利用该数据集进行多维度评估：按生成模型划分可研究特定架构的检测敏感性，按条件类型划分能验证跨模态泛化能力。建议采用ResNet-50等标准骨干网络进行基准测试，注意保持训练集与测试集在模型和条件分布上的独立性。对于鲁棒性研究，可施加降采样、JPEG压缩等退化操作。数据集提供的预定义分割方案支持直接进行跨域泛化实验，其均衡的样本分布有助于避免分类器偏差。

背景与挑战

背景概述

随着扩散模型在图像生成领域的崛起，遥感图像伪造检测面临前所未有的挑战。2025年5月，武汉大学遥感信息工程学院谭志鸿团队在arXiv发布RSFAKE-1M数据集，这是首个针对扩散模型生成遥感伪造图像的大规模基准数据集。该数据集包含50万张由10种遥感专用扩散模型生成的伪造图像，覆盖文本提示、结构引导等6种生成条件，并匹配50万张真实图像以平衡数据分布。作为当前规模最大的遥感伪造检测数据集，RSFAKE-1M填补了现有基准主要针对GAN生成内容的局限性，为环境监测、国土安全等关键领域的可信遥感分析提供了重要研究基础。

当前挑战

在领域问题层面，扩散模型生成的遥感图像具有细粒度纹理和全局一致性，其视觉与统计特征与真实图像高度接近，导致传统检测方法准确率平均下降37.2%。构建过程中，研究团队需解决三大核心挑战：多模态生成条件的统一标注框架设计，确保10种扩散模型输出质量的一致性，以及真实图像与伪造图像在分辨率、地物分布等维度的精准匹配。实验表明，现有检测器在跨模型、跨条件测试时性能波动达41.5%，凸显了该领域对鲁棒特征提取方法的迫切需求。

常用场景

经典使用场景

RSFAKE-1M数据集在遥感图像伪造检测领域具有广泛的应用场景，尤其在环境监测、城市规划和国家安全等关键领域。该数据集通过提供50万张真实和50万张伪造的遥感图像，覆盖了六种生成条件和十种扩散模型，为研究人员提供了丰富的实验材料。其经典使用场景包括训练和评估新型伪造检测算法，特别是在处理扩散模型生成的伪造图像时，能够显著提升模型的泛化能力和鲁棒性。

解决学术问题

RSFAKE-1M数据集解决了遥感图像伪造检测领域中的多个关键学术问题。首先，它填补了现有数据集中扩散模型生成伪造图像的空白，使得研究人员能够更全面地评估检测算法的性能。其次，该数据集通过多样化的生成条件和模型，帮助研究者理解不同伪造技术的特征差异，从而开发出更具针对性的检测方法。此外，RSFAKE-1M还支持跨数据集和跨条件的泛化分析，为提升检测模型的适应性和鲁棒性提供了重要支持。

实际应用

在实际应用中，RSFAKE-1M数据集为遥感图像的真实性验证提供了强有力的工具。例如，在环境监测中，该数据集可以帮助识别伪造的卫星图像，避免因虚假数据导致的错误决策。在城市规划领域，它能够确保所使用的遥感图像真实可靠，从而支持科学的城市发展策略。此外，国家安全部门也可以利用该数据集训练高效的伪造检测模型，防范潜在的虚假信息威胁。RSFAKE-1M的广泛应用为多个领域的数据真实性保障提供了重要支持。

数据集最近研究