MIMLv2
收藏arXiv2025-08-29 更新2025-11-25 收录
下载链接:
https://github.com/qcf-568/MIML
下载链接
链接失效反馈官方服务:
资源简介:
MIMLv2是一个大规模、多样化的高质量数据集,包含246,212张手动伪造的图像,并带有像素级的掩码注释。这是现有手工制作数据集如IMD20的120倍以上。数据集的创建是为了解决图像操作定位任务中大规模高质量数据的稀缺问题。数据集的构建利用了一个新的范式CAAAv2,它能够自动准确地标注伪造区域,并通过一个新的度量QES过滤掉不可靠的注释。此外,还引入了Object Jitter技术,通过生成高质量的操纵痕迹来进一步扩大数据集的大小和多样性。MIMLv2数据集显著提高了各种模型在广泛使用的基准测试上的泛化能力,有助于解决图像操作定位任务中的数据稀缺问题。
MIMLv2 is a large-scale, diverse and high-quality dataset containing 246,212 manually forged images with pixel-level mask annotations. It is over 120 times larger than existing manually curated datasets such as IMD20. This dataset was developed to address the scarcity of large-scale, high-quality training data for the image manipulation localization task. The dataset was constructed using a novel paradigm, CAAAv2, which can automatically and accurately annotate forged regions and filter out unreliable annotations via a new metric QES. Additionally, the Object Jitter technique is introduced to further expand the dataset’s size and diversity by generating high-quality manipulation traces. The MIMLv2 dataset significantly enhances the generalization capability of various models on widely adopted benchmarks, helping to resolve the data scarcity issue in image manipulation localization tasks.
提供机构:
南华大学DLVC-Lab, 中国广东省广州市
创建时间:
2025-08-29
搜集汇总
数据集介绍

构建方式
在图像篡改定位研究领域,数据稀缺长期制约模型泛化能力的发展。MIMLv2数据集通过创新性的自动标注范式CAAAv2构建,首先从互联网收集24.6万对真实篡改图像及其原始图像,经过去重和清洗后,利用自监督分类器将图像对划分为共享探针组(SPG)与共享供体组(SDG)。针对SPG图像采用差异感知语义分割模型,结合图像差分图与语义信息生成像素级标注;对于SDG图像则通过冻结DINOv2骨干的关联匹配模型提取鲁棒特征。最终通过质量评估指标QES过滤低质量标注,确保数据集的精确性与可靠性。
特点
该数据集在图像取证领域展现出显著优势:其核心价值在于囊括24.6万张人工篡改图像,规模达到传统手工标注数据集IMD20的120倍,有效缓解了数据稀缺问题。数据多样性体现在覆盖复制粘贴、拼接、移除及生成式篡改等多种篡改类型,图像分辨率跨度从45×120至13846×9200像素,且源自数十万用户使用不同软件制作的真实篡改案例。现代性特征表现为所有图像均采集自近期网络数据,反映了当前主流的摄影技术与篡改手法,相较于十余年前的CASIA等传统数据集更具时效性。
使用方法
该数据集为图像篡改定位模型训练提供重要支撑。研究者可将MIMLv2作为基础训练集,结合传统数据集(如CASIAv2、tampCOCO)进行联合训练,输入图像统一缩放至512×512分辨率,采用交叉熵损失与AdamW优化器进行端到端优化。为提升模型鲁棒性,可同步应用Object Jitter数据增强技术,通过对真实图像中随机物体进行尺寸抖动、曝光调整和纹理变换,生成具有细微篡改痕迹的辅助训练样本。在评估阶段,模型在CASIAv1、Coverage等七大基准测试集上的IoU与F1分数表明,引入该数据集能使各类模型性能提升约31%。
背景与挑战
背景概述
MIMLv2数据集由华南理工大学与北京大学等机构于2025年联合构建,聚焦图像篡改定位领域的关键问题。该领域因篡改图像可能引发信息安全风险而备受关注,但长期以来受限于高质量标注数据的严重匮乏。研究团队通过创新性引入网络公开的手工篡改图像资源,结合类别感知自动标注技术CAAAv2与质量评估指标QES,构建了包含24.6万对像素级标注的大规模数据集。这一工作突破了传统手工标注的成本瓶颈,为图像取证研究提供了前所未有的数据支撑,显著推动了篡改检测模型泛化能力的提升。
当前挑战
在图像篡改定位领域,模型常因真实篡改数据的稀缺而过度拟合合成数据的特定模式,导致实际应用性能受限。MIMLv2构建过程中面临双重挑战:其一需解决共享供体组与共享探针组图像的结构差异对自动标注精度的影响,其二是从海量网络数据中筛选高质量样本时需克服传输噪声与篡改痕迹微弱等干扰。通过冻结预训练骨干网络与多维度特征去噪策略,研究团队有效提升了标注可靠性,但如何保持数据规模扩张与质量控制的平衡仍是持续优化的核心议题。
常用场景
经典使用场景
在数字图像取证研究领域,MIMLv2数据集作为大规模人工伪造图像标注资源,主要应用于图像篡改定位模型的训练与评估。该数据集通过自动化标注范式CAAAv2对网络收集的篡改图像进行像素级标注,为深度学习模型提供了丰富的篡改模式学习样本。其经典使用场景包括训练端到端的篡改检测网络,验证模型在复杂真实篡改案例中的泛化能力,以及作为基准数据集推动图像取证技术的标准化发展。
实际应用
在实际应用层面,MIMLv2支撑的篡改检测技术已延伸至多个关键领域。社交媒体平台利用其训练的模型识别虚假信息图像,防止恶意内容传播;司法鉴定机构借助该技术验证数字证据的真实性;新闻媒体行业通过自动化检测系统核实图片来源与完整性。随着深度伪造技术的普及,该数据集衍生的检测方法在维护数字内容可信度方面发挥着日益重要的作用,为构建安全可靠的数字信息生态提供了技术保障。
衍生相关工作
基于MIMLv2数据集衍生出了一系列创新性研究工作。Web-IML模型通过多尺度感知与自校正模块实现了对网络监督数据的高效利用;Object Jitter方法通过语义保持的物体扰动技术进一步扩展了训练数据的多样性。在学术领域,该数据集推动了类别感知自动标注范式的发展,促进了冻结骨干网络与特征去噪等新方法的探索。这些衍生工作共同构成了图像篡改检测的技术体系,为后续研究提供了重要的理论参考与方法论支撑。
以上内容由遇见数据集搜集并总结生成



