BiometricLab-DTU-Splice Dataset

Name: BiometricLab-DTU-Splice Dataset
Creator: 德里理工大学信息科技系生物识别研究实验室
Published: 2024-01-13 14:58:29
License: 暂无描述

arXiv2024-01-13 更新2024-06-21 收录

下载链接：

https://www.kaggle.com/datasets/divg07/casia-20-image-tampering-detection-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

BiometricLab-DTU-Splice Dataset是由德里理工大学信息科技系生物识别研究实验室创建的新型图像拼接检测数据集，包含自动生成和手动编辑两种变体，共计22524个样本。该数据集通过Python代码和Adobe Photoshop软件生成，每个样本包括原始图像、拼接图像及其对应的二值掩码，适用于深度学习模型提取区分性特征而不会过拟合。数据集主要用于图像拼接检测研究，旨在解决图像篡改检测问题，提高社会对视觉数据的信任度。

The BiometricLab-DTU-Splice Dataset is a novel image splicing detection dataset created by the Biometrics Research Laboratory, Department of Information Technology, Delhi Technological University. It contains two variants: automatically generated and manually edited, with a total of 22,524 samples. Generated via Python code and Adobe Photoshop software, each sample includes the original image, the spliced image, and its corresponding binary mask, which is suitable for deep learning models to extract discriminative features without overfitting. The dataset is primarily used for image splicing detection research, aiming to address the problem of image tampering detection and enhance public trust in visual data.

提供机构：

德里理工大学信息科技系生物识别研究实验室

创建时间：

2024-01-13

搜集汇总

数据集介绍

构建方式

BiometricLab-DTU-Splice Dataset 数据集构建方式描述：该数据集由两部分组成，第一部分是通过代码自动生成的拼接样本，第二部分是通过手动编辑生成的拼接样本。两种变体的拼接图像都有相应的二值掩码，以便进行定位。数据集的构建旨在解决现有拼接数据集数量和规模不足的问题，以避免深度学习模型在提取判别特征时过拟合。

特点

BiometricLab-DTU-Splice Dataset 数据集特点描述：该数据集具有两个变体，一个是自动生成的拼接样本，另一个是手动编辑生成的拼接样本。两种变体的拼接图像都有相应的二值掩码，以便进行定位。数据集的特点在于其规模较大，为拼接检测研究领域提供了重要的补充。

使用方法

BiometricLab-DTU-Splice Dataset 数据集使用方法描述：该数据集可以用于训练和评估拼接检测模型。数据集中的拼接图像和二值掩码可以用于训练模型，以学习如何检测图像中的拼接操作。此外，数据集中的原始图像也可以用于训练模型，以学习如何区分原始图像和拼接图像。

背景与挑战

背景概述

随着社交媒体平台的普及，图像篡改和拼接技术的使用日益增多，对社会造成潜在威胁。为了应对这一挑战，Ankit Yadav和Dinesh Kumar Vishwakarma于2022年在印度德里理工大学信息科技系生物识别研究实验室提出了BiometricLab-DTU-Splice Dataset。该数据集包含两种变体：自动生成的拼接样本和手动编辑的拼接样本，每种变体都附有相应的二值掩码，以辅助定位方法。此外，研究人员还提出了一种名为“轻量级双分支信息保留空间压缩模式拼接检测框架”的新型框架，该框架在确保准确性的同时，将计算成本降至最低。该框架包含一个用于提取空间特征的轻量级空间分支，以及一个使用原始分辨率压缩数据提取双重压缩痕迹的信息保留压缩分支。

当前挑战

拼接检测模型的建立面临着数据集规模小、易过拟合的挑战。现有的拼接检测数据集数量和规模有限，难以满足深度学习模型提取区分特征的需求。此外，拼接检测框架的设计需要兼顾计算效率和准确性，避免因模型过于复杂而导致的过拟合问题。BiometricLab-DTU-Splice Dataset和轻量级双分支信息保留空间压缩模式拼接检测框架的提出，为解决这些问题提供了新的思路和方法。

常用场景

经典使用场景

在数字图像的篡改检测领域中，图像拼接检测模型显得尤为重要，因为拼接操作可以被用来误导公众、散布谣言和制造社会动荡。然而，图像拼接数据集的缺乏限制了深度学习模型在不过度拟合的情况下提取判别特征的能力。BiometricLab-DTU-Splice Dataset是一个包含两种变体的新型拼接检测数据集，旨在为图像拼接检测研究提供更为丰富的数据支持。

解决学术问题

BiometricLab-DTU-Splice Dataset解决了图像拼接检测研究中数据集规模较小的问题，提供了更为丰富的数据资源，有助于深度学习模型在不过度拟合的情况下提取判别特征。同时，该数据集包含自动生成和手动拼接两种变体，以及对应的二值掩码，有助于定位拼接区域，为图像拼接检测研究提供了更为全面的实验数据。

衍生相关工作

BiometricLab-DTU-Splice Dataset的提出，推动了图像拼接检测研究的发展，为后续的研究工作提供了重要的数据基础。基于该数据集，研究者可以设计更为复杂的图像拼接检测算法，并对其进行评估和优化。同时，该数据集还可以用于研究图像拼接检测算法在实际应用中的表现，以及不同场景下算法的适应性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集