five

Real-RSCM

收藏
arXiv2025-03-23 更新2025-03-26 收录
下载链接:
https://github.com/shenyedepisa/CM-MMoE
下载链接
链接失效反馈
官方服务:
资源简介:
Real-RSCM数据集由中国海洋大学信息科学与工程学院创建,包含10,000张分辨率为512x512像素的图像,从中精心挑选了8,620张复制移动篡改图像和1,380张未篡改图像作为负面样本。数据集中的图像经过人工处理,包括车辆、飞机、船只、建筑物、道路和植被等显著目标被手动缩放、旋转并复制到图像中的合理位置。每个篡改图像都配对了至少14个问题和50个可能的答案,形成了173,780个图像-问题-答案三元组。该数据集针对遥感图像的复制移动篡改检测任务,提供了更加真实的评价指标,适用于土地资源监测和国防安全等领域。

The Real-RSCM dataset was created by the College of Information Science and Engineering, Ocean University of China. It contains 10,000 images with a resolution of 512×512 pixels, among which 8,620 copy-move forgery images and 1,380 untampered images were carefully selected as negative samples. The images in the dataset were manually processed: prominent objects including vehicles, aircraft, ships, buildings, roads and vegetation were manually scaled, rotated and copied to reasonable positions within the images. Each tampered image is paired with at least 14 questions and 50 possible answers, forming a total of 173,780 image-question-answer triples. Aimed at the copy-move forgery detection task for remote sensing images, this dataset provides more realistic evaluation metrics, and is applicable to fields such as land resource monitoring and national defense security.
提供机构:
中国海洋大学信息科学与工程学院
创建时间:
2025-03-23
搜集汇总
数据集介绍
main_image_url
构建方式
Real-RSCM数据集通过精心筛选来自WHU-Building、IAILD、HRSC等六个全球27个区域的遥感图像,构建了一个包含10,000张512x512像素图像的高质量数据集。其中8,620张为经过复制-移动篡改的图像,1,380张为未篡改的负样本。篡改过程由人工完成,确保空间逻辑合理性和隐蔽性,涉及车辆、飞机、船舶等六类显著目标。每张篡改图像关联至少14个问题和50个可能答案,共计173,780个图像-问题-答案三元组。
特点
Real-RSCM数据集以其高度真实的篡改场景和复杂的语义关系脱颖而出。篡改区域经过人工标注,空间布局合理且隐蔽性高,模拟了真实世界中的篡改行为。数据集中的问题分为基础、独立和相关三类,涵盖了从整体感知到篡改区域间关系的多层次理解。与现有数据集相比,Real-RSCM避免了随机生成篡改图像带来的空间逻辑缺失问题,为目标检测和语义理解提供了更可靠的评估基准。
使用方法
该数据集主要用于训练和评估遥感图像复制-移动篡改理解模型。研究人员可利用其丰富的图像-问题-答案三元组,开发多模态模型以实现对篡改场景的深度理解。使用时应将70%数据用于训练,15%用于验证,15%用于测试。建议采用类似CM-MMoE的多专家混合模型架构,通过视觉分支提取篡改区域、源区域和背景的层次表示,再与文本特征进行多模态融合,实现对不同问题的准确回答。
背景与挑战
背景概述
Real-RSCM数据集由海洋大学信息科学与工程学院的张泽、赵恩源等研究人员于2025年提出,旨在解决遥感图像复制-移动篡改检测与理解的核心问题。该数据集包含10,000张高分辨率遥感图像和173,780个图像-问题-答案三元组,通过人工标注确保了篡改区域的空间逻辑性和隐蔽性。作为首个专注于遥感场景的复制-移动篡改问答数据集,其构建基于WHU-Building、iSAID等六大权威遥感数据集,覆盖全球27个区域的典型地物目标。该数据集的发布填补了传统自然图像篡改检测数据集在遥感领域的适用性空白,为国防安全监测和国土资源调查提供了更贴近真实场景的评估基准。
当前挑战
Real-RSCM数据集面临双重技术挑战:在领域问题层面,遥感图像独特的俯视视角、广域监测特性及小目标密集分布导致篡改区域与源区域的光学特征高度相似,传统基于特征匹配的单模态方法难以识别经过旋转缩放的精细篡改操作。在构建过程中,需克服人工标注的语义一致性难题,如区分固定翼飞机与直升机等易混淆目标类别,同时确保8,620组篡改案例的空间合理性。数据集特别设计的14类问题中,涉及篡改区域相对位置判定的第14类问题准确率仅为59.57%,暴露出当前模型在空间关系推理上的局限性。此外,多模态特征融合时如何平衡视觉分支的篡改检测损失与文本分支的问答损失,也是模型优化的关键挑战。
常用场景
经典使用场景
Real-RSCM数据集在遥感图像篡改检测领域具有重要应用价值。该数据集通过精心设计的人工标注方式,提供了高质量的篡改图像和对应的问答对,为研究者在多模态视觉问答任务中提供了可靠的基准。数据集中的篡改图像具有高度的隐蔽性和空间逻辑性,能够有效模拟真实场景中的篡改行为,为模型训练和评估提供了丰富的素材。
实际应用
Real-RSCM数据集在实际应用中展现出广泛的价值。在国防安全领域,该数据集可用于训练和评估遥感图像篡改检测系统,帮助识别潜在的军事目标伪装或地形篡改。在国土资源监测方面,数据集支持开发自动化检测工具,用于发现非法用地或环境破坏行为。此外,数据集还可应用于数字取证领域,为司法鉴定提供技术支撑。
衍生相关工作
Real-RSCM数据集推动了多项相关研究工作的开展。基于该数据集,研究者提出了多模态门控混合专家模型(CM-MMoE),该模型通过融合视觉和文本特征,显著提升了篡改检测的准确性。此外,数据集还激发了针对遥感图像篡改理解的新方法探索,如基于语义分割的辅助检测技术和跨模态注意力机制的应用。这些工作共同推动了遥感图像安全领域的技术发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作