AIRD-Datasets

github2023-03-14 更新2024-05-31 收录

下载链接：

https://github.com/isi-vista/AIRD-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

本仓库提供用于论文《AIRD: Adversarial Learning Framework for Image Repurposing Detection》中的预处理数据集，包括Google Landmarks、IJBC-IRD和Painter by Numbers等数据集，用于支持图像再利用检测模型的训练和评估。

本仓库收录了《AIRD：针对图像再利用检测的对抗学习框架》一文中提及的预处理数据集，涵盖Google Landmarks、IJBC-IRD以及Painter by Numbers等多个数据集，旨在为图像再利用检测模型的训练与评估提供支持。

创建时间：

2019-03-26

原始信息汇总

数据集概述

数据集名称及来源

Google Landmarks
- 来源: Kaggle
- 图像内容: 室内/室外场景
- 标签: 地标ID (13,885个唯一ID)
- 训练大小: 977,624张图像
- 测试大小: 238,965张图像
- 编码: NetVLAD + PCA + L<sub>2</sub>-norm
IJBC-IRD
- 来源: NIST
- 图像内容: 裁剪和校准的人脸
- 标签: 主体ID (1,649个唯一ID)
- 训练大小: 13,748张图像
- 测试大小: 2,629张图像
- 编码: Face-ResNet + PCA + Signed-Square Rooting
Painter by Numbers
- 来源: Kaggle
- 图像内容: 绘画作品
- 标签: 艺术家ID (1,000个唯一ID)
- 训练大小: 58,701张图像
- 测试大小: 14,162张图像
- 编码: ConvNet + L<sub>2</sub>-norm

下载链接

Google Landmarks: 下载链接
IJBC-IRD: 下载链接
Painter by Numbers: 下载链接

文件结构与加载

编码文件: encoding_<split>.h5 (HDF5格式，使用h5py加载)
元数据文件: metadata_<split>.csv (CSV格式，使用pandas加载)
预计算检索文件: precomputed_retrievals_<split>.npy (NumPy二进制格式，使用NumPy加载)

其中 <split> 取值: train 和 test。

搜集汇总

数据集介绍

构建方式

AIRD-Datasets的构建基于对抗学习框架，旨在检测图像的重用行为。该数据集整合了来自多个公开数据源的图像，包括Google Landmarks、IJBC-IRD和Painter by Numbers，涵盖了地标、人脸和绘画三个不同领域。每类图像均经过预处理，提取了NetVLAD、Face-ResNet和ConvNet等深度学习模型的编码特征，并结合PCA和L2归一化等技术进行降维和标准化处理。数据集进一步划分为训练集和测试集，并提供了预计算的相似性检索索引，以便于模型训练和评估。

使用方法

使用AIRD-Datasets时，用户可通过提供的下载链接获取压缩文件，解压后即可访问图像编码、标签和预计算检索索引等数据。图像编码以HDF5格式存储，标签以CSV格式存储，检索索引则以NumPy二进制格式存储。用户可通过h5py、pandas和NumPy等Python库加载数据。数据集已划分为训练集和测试集，用户可直接用于模型训练和性能评估。此外，预计算的检索索引可加速相似性检索任务，为图像重用检测提供高效支持。

背景与挑战

背景概述

AIRD-Datasets是由Ayush Jaiswal、Yue Wu、Wael AbdAlmageed、Iacopo Masi和Premkumar Natarajan等研究人员于2019年提出的，旨在支持图像重用途检测的研究。该数据集作为论文《AIRD: Adversarial Learning Framework for Image Repurposing Detection》的补充材料，发布于CVPR会议。数据集涵盖了多个领域的图像数据，包括地标场景、人脸和绘画作品，旨在通过对抗学习框架提升图像重用途检测的准确性。该数据集为图像语义完整性评估提供了重要的实验基础，推动了多媒体数据安全领域的研究进展。

当前挑战

AIRD-Datasets在解决图像重用途检测问题时面临多重挑战。首先，图像重用途检测需要区分原始图像与经过篡改的图像，这对模型的鲁棒性和泛化能力提出了极高要求。其次，数据集的构建过程中，研究人员需从不同来源（如Google Landmarks、IJBC-IRD和Painter by Numbers）整合数据，并确保数据的一致性和标注的准确性。此外，图像编码的预处理（如NetVLAD和Face-ResNet）以及相似性检索的计算也增加了数据集的复杂性。这些挑战不仅体现在数据集的构建上，也影响了后续模型的训练与评估。

常用场景

经典使用场景

AIRD-Datasets在图像重用途检测领域具有广泛的应用，尤其是在对抗性学习框架中。该数据集通过提供来自Google Landmarks、IJBC-IRD和Painter by Numbers的预处理图像数据，支持研究人员训练和评估图像重用途检测模型。这些数据集涵盖了地标、人脸和绘画等多个领域，能够有效模拟真实世界中的图像重用途场景，为模型提供了丰富的训练和测试样本。

解决学术问题

AIRD-Datasets解决了图像重用途检测中的关键学术问题，特别是在对抗性学习框架下的模型训练和评估。通过提供多样化的图像数据及其对应的标签，该数据集帮助研究人员开发出能够有效识别图像是否被恶意篡改或重用途的算法。这不仅提升了图像语义完整性评估的准确性，还为多媒体数据的安全性和可信度提供了技术保障。

实际应用

在实际应用中，AIRD-Datasets被广泛用于图像取证、版权保护和社交媒体内容审核等领域。例如，在社交媒体平台上，该数据集可以帮助检测用户上传的图像是否被篡改或盗用，从而维护内容的真实性和版权。此外，在数字取证中，该数据集支持执法机构识别伪造图像，为案件调查提供技术依据。

数据集最近研究