adversarial_pcam

Hugging Face2025-01-30 更新2025-02-10 收录

下载链接：

https://huggingface.co/datasets/lens-ai/adversarial_pcam

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了对PatchCamelyon (PCAM)图像使用多种攻击技术生成的对抗样本，旨在欺骗特定的微调模型。数据集结构包括训练数据、原始图像、扰动掩码和一个包含详细元数据的JSON文件。数据集可用于评估模型对抗攻击的鲁棒性、使用对抗数据训练模型以提高韧性以及基准测试新的对抗防御机制。

创建时间：

2025-01-30

原始信息汇总

Adversarial PCAM Dataset

数据集标签

adversarial
image-classification
robustness
deep-learning
computer-vision

任务类别

image-classification

模型

lens-ai/clip-vit-base-patch32_pcam_finetuned

数据集描述

本数据集包含使用各种攻击技术生成的PatchCamelyon (PCAM)图像的对抗性示例。对抗性图像旨在欺骗以下经过微调的模型：lens-ai/clip-vit-base-patch32_pcam_finetuned。

研究人员和工程师可以使用此数据集：

评估模型对抗攻击的鲁棒性
使用对抗性数据进行模型训练以改善其弹性
对新的对抗性防御机制进行基准测试

数据集结构

organized_dataset/ ├── train/ │ ├── 0/ # 负样本（仅对抗性图像） │ │ └── adv_0_labelfalse_pred1_SquareAttack.png │ └── 1/ # 正样本（仅对抗性图像） │ └── adv_1_labeltrue_pred0_SquareAttack.png ├── originals/ # 原始图像 │ ├── orig_0_labelfalse_SquareAttack.png │ └── orig_1_labeltrue_SquareAttack.png ├── perturbations/ # 扰动掩码 │ ├── perturbation_0_SquareAttack.png │ └── perturbation_1_SquareAttack.png └── dataset.json

每个对抗性示例包括：

train/{0,1}/adv_{id}_label{true/false}_pred{pred_label}_{attack_name}.png → 带有模型预测的对抗性图像
originals/orig_{id}_label{true/false}_{attack_name}.png → 扰动前的原始图像
perturbations/perturbation_{id}_{attack_name}.png → 应用到原始图像的扰动
文件名中的攻击名称指示使用了哪种方法

dataset.json 文件包含每个样本的详细元数据，包括： json { "attack": "SquareAttack", "type": "black_box_attacks", "perturbation": "perturbations/perturbation_1_SquareAttack.png", "adversarial": "train/0/adv_1_labelfalse_pred1_SquareAttack.png", "original": "originals/orig_1_labelfalse_SquareAttack.png", "label": 0, "prediction": 1 }

攻击类型

数据集包含黑盒和非黑盒对抗性攻击。

黑盒攻击

这些攻击不需要访问模型梯度：

HopSkipJump Attack

查询高效的黑盒攻击，估计梯度
基于决策边界近似

Zoo Attack

零阶优化（ZOO）攻击
通过有限差分方法估计梯度

非黑盒攻击

这些攻击需要访问模型梯度：

SimBA (Simple Black-box Attack)

使用随机扰动误导模型
减少查询复杂度

Boundary Attack

查询高效的攻击，沿决策边界移动
最小化扰动大小

Spatial Transformation Attack

使用旋转、缩放和平移
不需要像素级扰动

使用方式

python import json import torch from torchvision import transforms from PIL import Image from pathlib import Path

加载数据集信息

with open(organized_dataset/dataset.json, r) as f: dataset_info = json.load(f)["train"]["rows"]

定义转换

transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor() ])

加载和处理图像的函数

def load_image(image_path): img = Image.open(image_path).convert("RGB") return transform(img)

示例：加载一组相关图像（原始、对抗性和扰动）

for entry in dataset_info: # 加载对抗性图像 adv_path = Path(organized_dataset) / entry[image_path] adv_image = load_image(adv_path)

# 加载原始图像
orig_path = Path(organized_dataset) / entry[original_path]
orig_image = load_image(orig_path)

# 加载扰动（如果有）
if entry[perturbation_path]:
    pert_path = Path(organized_dataset) / entry[perturbation_path]
    pert_image = load_image(pert_path)

# 访问元数据
attack_type = entry[attack]
label = entry[label]
prediction = entry[prediction]

print(f"Attack: {attack_type}")
print(f"True Label: {label}")
print(f"Model Prediction: {prediction}")
print(f"Image shapes: {adv_image.shape}")

攻击成功率

每种攻击在目标模型上的成功率： json { "HopSkipJump": {"success_rate": 14}, "Zoo_Attack": {"success_rate": 22}, "SimBA": {"success_rate": 99}, "Boundary_Attack": {"success_rate": 98}, "SpatialTransformation_Attack": {"success_rate": 99} }

引用

bibtex @article{lensai2025adversarial, title={Adversarial PCAM Dataset}, author={LensAI Team}, year={2025}, url={https://huggingface.co/datasets/lens-ai/adversarial_pcam} }

搜集汇总

数据集介绍

构建方式

该数据集通过在PatchCamelyon（PCAM）图像上应用多种攻击技术生成对抗性样例而构建。对抗性图像旨在欺骗经过微调的模型：lens-ai/clip-vit-base-patch32_pcam_finetuned。数据集包括训练集、原始图像、扰动遮罩以及包含每个样本详细元数据的dataset.json文件。

特点

Adversarial PCAM数据集的特点在于它包含了多种对抗性攻击技术生成的图像，涵盖了黑盒攻击和非黑盒攻击。数据集结构清晰，每个对抗性样例都包括对抗性图像、原始图像、应用的扰动遮罩和元数据信息，使得研究者和工程师能够评估模型的鲁棒性、使用对抗数据进行模型训练以及基准化新的对抗性防御机制。

使用方法

使用该数据集时，用户可以通过加载dataset.json文件来获取训练集的信息，并通过定义的图像加载函数来处理和加载原始图像、对抗性图像以及扰动遮罩。此外，数据集提供了每种攻击的成功率，便于用户理解和评估不同攻击方法的效果。

背景与挑战

背景概述

Adversarial PCAM数据集，创建于2025年，由LensAI团队精心构建，旨在通过对抗性样本的生成与利用，对深度学习模型在图像分类领域的鲁棒性进行评估与提升。该数据集基于PatchCamelyon（PCAM）图像，采用多种攻击技术生成对抗性样本，以欺骗经过微调的模型[lens-ai/clip-vit-base-patch32_pcam_finetuned]。该数据集不仅为研究人员和工程师提供了评估模型鲁棒性的工具，也用于训练更具弹性的模型，并对新的对抗性防御机制进行基准测试，对计算机视觉领域产生了深远的影响。

当前挑战

该数据集在构建过程中所面临的挑战包括：1)对抗性攻击技术的选择与应用，以确保能够有效欺骗目标模型；2)数据集结构的优化，以方便研究人员对对抗性样本、原始图像以及扰动掩码进行有效处理。在研究领域问题上，Adversarial PCAM数据集面临的挑战主要在于图像分类模型在对抗性攻击下的鲁棒性，以及如何通过训练提高模型对这类攻击的防御能力。

常用场景

经典使用场景

在深度学习与计算机视觉领域中，对抗样本的研究对于提升模型鲁棒性至关重要。Adversarial PCAM数据集便是为了评估和增强模型对抗攻击的鲁棒性而构建的。该数据集的经典使用场景在于，研究者可通过其提供的对抗样本，对预训练模型进行攻击测试，进而分析模型对于不同攻击技术的脆弱性。

解决学术问题

该数据集解决了模型在对抗攻击下鲁棒性不足的学术问题，通过提供多种攻击方法生成的对抗样本，使得研究者能够深入理解模型在面临不同攻击策略时的表现，进而指导模型设计和优化，提升模型对于实际应用中潜在攻击的防御能力。

衍生相关工作

基于Adversarial PCAM数据集，研究者已衍生出多项相关工作，包括开发新的对抗攻击方法、防御机制以及鲁棒性评估指标。这些工作进一步推动了对抗样本研究领域的进展，并为相关技术的实际应用提供了理论基础和实践指导。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集