SurFITR (Surveillance Forgery Image Test Range)
收藏arXiv2026-04-08 更新2026-04-10 收录
下载链接:
https://github.com/mike-qz-wang/SurFITR
下载链接
链接失效反馈官方服务:
资源简介:
SurFITR是由墨尔本大学和新加坡管理大学联合构建的监控场景图像伪造检测数据集,包含13.7万张经过局部篡改的监控图像,覆盖人类和物体的删除、替换、添加等精细操作。数据集通过多模态大模型驱动的自动化流程生成,整合了六种主流监控视频源和五种图像编辑模型,提供像素级篡改标注。其创新性体现在语义感知的局部篡改模拟、跨场景/跨模型的组合设计,以及针对监控场景低画质、小目标等特点的针对性构建,旨在解决现有伪造检测模型在监控场景中泛化性不足的问题,推动数字取证技术在安防领域的应用。
SurFITR is a surveillance scene image forgery detection dataset jointly constructed by the University of Melbourne and Singapore Management University. It contains 137,000 locally tampered surveillance images, covering fine-grained manipulations including deletion, replacement and addition of humans and objects. The dataset is generated via an automated pipeline driven by multimodal large models, integrating six mainstream surveillance video sources and five image editing models, and provides pixel-level tampering annotations. Its innovations lie in semantic-aware local tampering simulation, cross-scenario and cross-model combined design, and targeted construction tailored to the characteristics of surveillance scenes such as low image quality and small targets. It aims to address the insufficient generalization performance of existing forgery detection models in surveillance scenarios, and promote the application of digital forensics technology in the security field.
提供机构:
墨尔本大学; 新加坡管理大学
创建时间:
2026-04-08
原始信息汇总
SurFITR 数据集概述
数据集名称
SurFITR (Surveillance Forgery Image Test Range)
核心用途
用于监控风格图像伪造检测与定位。
开发背景
为应对开放访问图像生成模型的最新进展可能带来的伪造视觉证据风险而创建。现有的伪造检测模型在针对监控场景时泛化能力不足,因为监控图像中的篡改通常具有局部性、隐蔽性,且场景视角多变、主体小或被遮挡、视觉质量较低。
数据集内容与规模
- 图像数量:包含超过 137,000 张篡改图像。
- 图像特性:具有不同分辨率和编辑类型的图像。
- 生成方法:通过多模态大语言模型驱动的流程生成,支持跨多样监控场景的语义感知、细粒度编辑。使用了多种图像编辑模型进行生成。
实验验证
广泛的实验表明:
- 现有检测器在 SurFITR 数据集上性能显著下降。
- 在 SurFITR 上训练能显著提升模型在域内和跨域的性能。
许可证
数据集将在 CC BY-NC 4.0 许可证下发布。
引用信息
如需引用,请使用以下格式: bibtex @article{wang2026surfitr, title={SurFITR: A Dataset for Surveillance Image Forgery Detection and Localisation}, author={Wang, Qizhou and Pang, Guansong and Leckie, Christopher}, journal={arXiv preprint arXiv:2604.07101}, year={2026} }
相关资源链接
- 论文地址:https://arxiv.org/abs/2604.07101
- HuggingFace 数据集地址:https://huggingface.co/datasets/wqz995/SurFITR
- 附录地址:https://drive.google.com/file/d/1OaYEI_iWdoCq9JH3tY52qxV9P1Tu7Pvo/view?usp=sharing
搜集汇总
数据集介绍

构建方式
在监控图像取证领域,构建具有真实篡改特征的数据集面临独特挑战。SurFITR数据集通过一个多模态大语言模型驱动的自动化流水线构建,该流水线整合了开放词汇检测器、提示式分割模型以及多种前沿图像生成模型。首先,流水线从六个公开监控数据集中筛选具有取证价值的帧,并利用多模态大语言模型生成语义感知的篡改指令;随后,基于像素级掩码进行局部化、细粒度的图像编辑,涵盖移除、针对性替换、开放式替换及添加四种篡改类型;最后,通过自动化验证与质量筛选机制,确保篡改区域的视觉合理性与篡改痕迹的隐蔽性,最终形成包含超过13.7万对篡改图像与对应真实图像的规模性数据集。
特点
SurFITR数据集的核心特点在于其专注于监控场景下的局部化、细粒度图像篡改。与现有侧重于整图合成或大幅面篡改的数据集不同,该数据集模拟真实监控环境中常见的细微篡改操作,如对画面中特定人物或物体的移除、替换与添加,篡改区域通常较小且与场景语义高度一致。数据集涵盖多样化的监控场景,包括室内外环境、公共场所及拥挤区域,图像在分辨率、色彩模式及视觉质量上存在显著差异。此外,数据集通过组合不同来源语料、篡改类型、实体类别及生成模型,形成了结构化的基准,支持跨场景、跨模型及跨篡改类型的泛化性研究,为监控图像取证提供了高度逼真且富有挑战性的评估与训练资源。
使用方法
SurFITR数据集主要服务于监控图像篡改检测与定位的研究与评估。作为测试基准,研究者可利用其评估现有取证模型及多模态大语言模型在监控场景下的零样本性能,揭示模型在细微、局部化篡改上的泛化局限。作为训练资源,数据集支持对专用检测与定位模型进行微调,显著提升模型在监控域内及跨域的检测与定位能力。数据集的标准化划分包含基础集与迁移集,基础集用于模型训练与域内评估,迁移集则基于不同生成模型构建,专用于评估模型在生成方式差异下的跨域泛化性能。此外,数据集提供的像素级真实掩码为监督学习提供了精确的定位标签,助力于开发能够应对监控场景复杂性与篡改隐蔽性的鲁棒性取证算法。
背景与挑战
背景概述
随着开放获取图像生成模型的迅猛发展,伪造视觉证据的风险日益凸显,对图像真实性鉴证技术提出了严峻挑战。在此背景下,墨尔本大学与新加坡管理大学的研究团队于2026年推出了SurFITR数据集,旨在专门应对监控场景下的图像伪造检测与定位难题。该数据集的核心研究问题在于弥补现有伪造检测模型在监控图像领域的泛化能力不足,因为监控图像通常具有视角多变、目标细小或被遮挡、视觉质量较低等特点,其中的篡改行为往往局部且细微。SurFITR通过一个由多模态大语言模型驱动的自动化流程,生成了超过13.7万张涵盖多种篡改类型的高价值监控图像,为开发面向真实世界监控场景的鲁棒性取证模型奠定了关键基础,显著推动了数字图像取证领域向更复杂、更实际应用场景的拓展。
当前挑战
SurFITR数据集致力于解决监控风格图像伪造检测与定位这一特定领域问题,其核心挑战在于现有模型难以泛化至具有局部、细微篡改特征的复杂监控场景。具体而言,领域问题的挑战体现在监控图像中篡改区域通常空间局部化、语义精细且视觉线索微弱,导致依赖全图合成或大范围篡改数据训练的现有检测器性能显著退化。在数据集构建过程中,挑战主要集中于如何实现大规模、语义感知的精细编辑。这需要设计自动化流程以理解复杂监控场景的上下文,生成视觉逼真且上下文一致的局部篡改指令,并确保生成结果在多样化的分辨率、色彩格式及活动场景中保持高质量,同时为每张图像提供精确的像素级真值掩码以支持定位模型的训练与评估。
常用场景
经典使用场景
在监控图像取证领域,SurFITR数据集主要服务于图像伪造检测与定位模型的训练与评估。该数据集通过模拟真实监控场景中局部、细微的篡改操作,为研究者提供了评估模型在复杂、低质量监控环境下泛化能力的基准。其经典使用场景包括:训练深度神经网络以识别监控画面中的人为添加、移除或替换实体等篡改行为,并精确定位被篡改的像素区域。实验表明,现有基于自然图像训练的检测器在SurFITR上性能显著下降,而利用该数据集进行微调则能大幅提升模型在监控场景下的检测与定位精度。
实际应用
SurFITR数据集的实际应用价值主要体现在提升公共安全与数字证据可信度方面。随着生成式AI技术的普及,伪造监控图像以干扰在线举报系统或制造虚假证据的风险日益增加。该数据集可用于开发和验证能够自动识别监控录像中恶意篡改的 forensic 工具,这些工具可部署于执法机构的证据审核流程、智慧城市的安全监控系统,以及新闻媒体的内容核实平台。通过训练基于SurFITR的检测模型,系统能够更可靠地发现监控画面中人物或物体的细微增减与替换,从而维护视觉证据的完整性,防范利用伪造图像进行的欺诈、诽谤或干扰司法公正的行为。
衍生相关工作
SurFITR数据集的发布催生了一系列专注于监控场景图像取证的衍生研究。基于该数据集,研究者们开始探索专门针对局部细微篡改的检测架构,例如改进的时空-通道相关性网络(PSCC-Net)和层次化细粒度检测网络(HiFi-Net)在SurFITR上的适配与优化。同时,该数据集也促进了多模态大语言模型(如Qwen系列)在零样本或指令微调模式下进行图像真实性推理的研究。这些工作不仅验证了SurFITR作为训练资源能显著提升现有模型(如TruFor、MVSSNet)的性能,更揭示了监控取证中模型对场景变化敏感、对小尺度篡改定位困难等核心挑战,为后续开发场景不变性特征学习和细粒度定位新方法奠定了基础。
以上内容由遇见数据集搜集并总结生成



