CASIAv2.0 dataset, COVERAGE dataset

github2024-03-19 更新2024-05-31 收录

下载链接：

https://github.com/SunnyHaze/IML-Dataset-Corrections

下载链接

链接失效反馈

官方服务：

资源简介：

图像操作定位（IML）任务涉及检测和定位图像内的篡改区域，可视为对抗Photoshop或Deepfake等方法的反制措施。然而，现有数据集中存在许多问题或分辨率错位，即篡改图像及其对应的掩码不具有相同的分辨率。本仓库解决了这些数据集中存在的分辨率问题。

The Image Manipulation Localization (IML) task involves detecting and localizing tampered regions within an image, serving as a countermeasure against methods such as Photoshop or Deepfake. However, existing datasets often suffer from issues such as resolution misalignment, where the tampered images and their corresponding masks do not share the same resolution. This repository addresses these resolution discrepancies present in the datasets.

创建时间：

2024-03-19

原始信息汇总

数据集概述

1. 数据集名称及目的

名称： Dataset Corrections for Common Image Manipulation Localization Datasets
目的： 解决现有图像篡改定位（IML）数据集中存在的分辨率不一致问题，确保篡改图像及其对应掩码具有相同分辨率。

2. 数据集问题及修正

2.1 CASIAv1.0 数据集

问题： 存在一张无对应掩码的额外图像。
解决方案： 建议在训练或评估时移除该图像。

2.2 CASIAv2.0 数据集

问题： 17张图像存在分辨率不一致问题。
解决方案： 已修正并提供下载链接：
- 仅修订图像：Google Drive / Baidu Netdisk
- 完整修订数据集：GitHub

2.3 COVERAGE 数据集

问题： 9张图像（27个掩码）存在分辨率不一致问题。
解决方案： 已修正并提供下载链接：
- 仅修订图像：Google Drive / Baidu Netdisk

2.4 IMD2020 数据集

问题： 单张图像存在分辨率不一致问题。
解决方案： 已上传修订掩码，可直接下载：

3. 社区支持与分享

鼓励社区成员在Discussions中提出其他IML数据集的问题，共同解决。
如发现本项目有价值，欢迎给予星标⭐️并分享，以支持社区的进一步合作。

搜集汇总

数据集介绍

构建方式

CASIAv2.0和COVERAGE数据集的构建旨在解决图像篡改定位任务中存在的分辨率不一致问题。通过对现有数据集的深入分析，研究人员识别出篡改图像与其对应掩码之间分辨率不匹配的情况，并进行了系统性修正。具体而言，针对CASIAv2.0数据集中的17幅图像以及COVERAGE数据集中的9幅图像，团队重新调整了图像与掩码的分辨率，确保两者在尺寸上完全一致。修正后的图像和掩码通过Google Drive和百度网盘等平台公开发布，以便研究社区使用。

特点

CASIAv2.0和COVERAGE数据集的特点在于其高精度的图像篡改定位能力。修正后的数据集确保了图像与掩码在分辨率上的严格对齐，为图像篡改检测算法的训练和评估提供了可靠的基础。此外，数据集涵盖了多种篡改类型和场景，包括复制-移动、拼接等常见篡改手段，能够全面反映实际应用中的复杂情况。数据集的开放性和透明性也促进了研究社区的协作与改进，为图像篡改定位领域的研究提供了重要支持。

使用方法

使用CASIAv2.0和COVERAGE数据集时，研究人员可通过提供的下载链接获取修正后的图像和掩码。这些数据可直接用于图像篡改定位算法的训练和测试，确保模型在分辨率对齐的数据上进行学习，从而提高检测精度。此外，数据集的使用者可通过GitHub平台提交问题或改进建议，参与数据集的持续优化。通过这种方式，研究社区能够共同推动图像篡改定位技术的发展，并为相关领域的研究提供更加可靠的数据支持。

背景与挑战

背景概述

CASIAv2.0与COVERAGE数据集是图像篡改定位（Image Manipulation Localization, IML）领域的重要资源，旨在检测和定位图像中的篡改区域。这些数据集由中国科学院自动化研究所（CASIA）等机构创建，广泛应用于对抗Photoshop或Deepfake等技术的研究。CASIAv2.0数据集作为CASIA系列的升级版本，包含了大量经过篡改的图像及其对应的掩码，为研究者提供了丰富的实验材料。然而，现有数据集中存在图像与掩码分辨率不一致的问题，影响了模型的训练与评估效果。为此，相关研究人员对这些问题进行了修正，并发布了修订后的数据集版本，进一步提升了数据集的可用性与研究价值。

当前挑战

CASIAv2.0与COVERAGE数据集在构建与应用过程中面临多重挑战。首先，图像篡改定位任务本身具有较高的复杂性，篡改区域的多样性与隐蔽性使得检测与定位难度显著增加。其次，数据集中存在图像与掩码分辨率不一致的问题，这不仅影响了模型的训练效果，还可能导致评估结果的偏差。此外，数据集的构建过程中需要确保篡改图像与掩码的精确对齐，这对数据标注的质量提出了严格要求。尽管研究人员已对这些问题进行了修正，但如何进一步提高数据集的规模与多样性，以及如何应对新兴篡改技术的挑战，仍是未来研究的重要方向。

常用场景

经典使用场景

CASIAv2.0和COVERAGE数据集在图像篡改检测领域具有重要地位，广泛应用于图像篡改定位（IML）任务中。这些数据集通过提供篡改图像及其对应的掩码，帮助研究人员开发和验证图像篡改检测算法。经典的使用场景包括训练深度学习模型，如卷积神经网络（CNN），以自动识别和定位图像中的篡改区域。

解决学术问题

CASIAv2.0和COVERAGE数据集解决了图像篡改检测领域中的关键问题，特别是篡改图像与掩码分辨率不一致的问题。通过修正这些数据集中的分辨率对齐问题，研究人员能够更准确地评估和比较不同算法的性能。这不仅提高了篡改检测的精度，还推动了该领域的学术研究进展。

衍生相关工作

基于CASIAv2.0和COVERAGE数据集，许多经典的研究工作得以展开。例如，研究人员开发了多种深度学习模型，如基于生成对抗网络（GAN）的篡改检测算法，以及结合多尺度特征融合的篡改定位方法。这些工作不仅提升了篡改检测的准确性，还为后续研究提供了宝贵的参考和基础。

以上内容由遇见数据集搜集并总结生成