five

adversarial_pcam

收藏
Hugging Face2025-01-30 更新2025-02-10 收录
下载链接:
https://huggingface.co/datasets/lens-ai/adversarial_pcam
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了对PatchCamelyon (PCAM)图像使用多种攻击技术生成的对抗样本,旨在欺骗特定的微调模型。数据集结构包括训练数据、原始图像、扰动掩码和一个包含详细元数据的JSON文件。数据集可用于评估模型对抗攻击的鲁棒性、使用对抗数据训练模型以提高韧性以及基准测试新的对抗防御机制。
创建时间:
2025-01-30
原始信息汇总

Adversarial PCAM Dataset

数据集标签

  • adversarial
  • image-classification
  • robustness
  • deep-learning
  • computer-vision

任务类别

  • image-classification

模型

  • lens-ai/clip-vit-base-patch32_pcam_finetuned

数据集描述

本数据集包含使用各种攻击技术生成的PatchCamelyon (PCAM)图像的对抗性示例。对抗性图像旨在欺骗以下经过微调的模型:lens-ai/clip-vit-base-patch32_pcam_finetuned

研究人员和工程师可以使用此数据集:

  • 评估模型对抗攻击的鲁棒性
  • 使用对抗性数据进行模型训练以改善其弹性
  • 对新的对抗性防御机制进行基准测试

数据集结构

organized_dataset/ ├── train/ │ ├── 0/ # 负样本(仅对抗性图像) │ │ └── adv_0_labelfalse_pred1_SquareAttack.png │ └── 1/ # 正样本(仅对抗性图像) │ └── adv_1_labeltrue_pred0_SquareAttack.png ├── originals/ # 原始图像 │ ├── orig_0_labelfalse_SquareAttack.png │ └── orig_1_labeltrue_SquareAttack.png ├── perturbations/ # 扰动掩码 │ ├── perturbation_0_SquareAttack.png │ └── perturbation_1_SquareAttack.png └── dataset.json

每个对抗性示例包括:

  • train/{0,1}/adv_{id}_label{true/false}_pred{pred_label}_{attack_name}.png → 带有模型预测的对抗性图像
  • originals/orig_{id}_label{true/false}_{attack_name}.png → 扰动前的原始图像
  • perturbations/perturbation_{id}_{attack_name}.png → 应用到原始图像的扰动
  • 文件名中的攻击名称指示使用了哪种方法

dataset.json 文件包含每个样本的详细元数据,包括: json { "attack": "SquareAttack", "type": "black_box_attacks", "perturbation": "perturbations/perturbation_1_SquareAttack.png", "adversarial": "train/0/adv_1_labelfalse_pred1_SquareAttack.png", "original": "originals/orig_1_labelfalse_SquareAttack.png", "label": 0, "prediction": 1 }

攻击类型

数据集包含黑盒和非黑盒对抗性攻击。

黑盒攻击

这些攻击不需要访问模型梯度:

HopSkipJump Attack

  • 查询高效的黑盒攻击,估计梯度
  • 基于决策边界近似

Zoo Attack

  • 零阶优化(ZOO)攻击
  • 通过有限差分方法估计梯度

非黑盒攻击

这些攻击需要访问模型梯度:

SimBA (Simple Black-box Attack)

  • 使用随机扰动误导模型
  • 减少查询复杂度

Boundary Attack

  • 查询高效的攻击,沿决策边界移动
  • 最小化扰动大小

Spatial Transformation Attack

  • 使用旋转、缩放和平移
  • 不需要像素级扰动

使用方式

python import json import torch from torchvision import transforms from PIL import Image from pathlib import Path

加载数据集信息

with open(organized_dataset/dataset.json, r) as f: dataset_info = json.load(f)["train"]["rows"]

定义转换

transform = transforms.Compose([ transforms.Resize((224, 224)), transforms.ToTensor() ])

加载和处理图像的函数

def load_image(image_path): img = Image.open(image_path).convert("RGB") return transform(img)

示例:加载一组相关图像(原始、对抗性和扰动)

for entry in dataset_info: # 加载对抗性图像 adv_path = Path(organized_dataset) / entry[image_path] adv_image = load_image(adv_path)

# 加载原始图像
orig_path = Path(organized_dataset) / entry[original_path]
orig_image = load_image(orig_path)

# 加载扰动(如果有)
if entry[perturbation_path]:
    pert_path = Path(organized_dataset) / entry[perturbation_path]
    pert_image = load_image(pert_path)

# 访问元数据
attack_type = entry[attack]
label = entry[label]
prediction = entry[prediction]

print(f"Attack: {attack_type}")
print(f"True Label: {label}")
print(f"Model Prediction: {prediction}")
print(f"Image shapes: {adv_image.shape}")

攻击成功率

每种攻击在目标模型上的成功率: json { "HopSkipJump": {"success_rate": 14}, "Zoo_Attack": {"success_rate": 22}, "SimBA": {"success_rate": 99}, "Boundary_Attack": {"success_rate": 98}, "SpatialTransformation_Attack": {"success_rate": 99} }

引用

bibtex @article{lensai2025adversarial, title={Adversarial PCAM Dataset}, author={LensAI Team}, year={2025}, url={https://huggingface.co/datasets/lens-ai/adversarial_pcam} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过在PatchCamelyon(PCAM)图像上应用多种攻击技术生成对抗性样例而构建。对抗性图像旨在欺骗经过微调的模型:lens-ai/clip-vit-base-patch32_pcam_finetuned。数据集包括训练集、原始图像、扰动遮罩以及包含每个样本详细元数据的dataset.json文件。
特点
Adversarial PCAM数据集的特点在于它包含了多种对抗性攻击技术生成的图像,涵盖了黑盒攻击和非黑盒攻击。数据集结构清晰,每个对抗性样例都包括对抗性图像、原始图像、应用的扰动遮罩和元数据信息,使得研究者和工程师能够评估模型的鲁棒性、使用对抗数据进行模型训练以及基准化新的对抗性防御机制。
使用方法
使用该数据集时,用户可以通过加载dataset.json文件来获取训练集的信息,并通过定义的图像加载函数来处理和加载原始图像、对抗性图像以及扰动遮罩。此外,数据集提供了每种攻击的成功率,便于用户理解和评估不同攻击方法的效果。
背景与挑战
背景概述
Adversarial PCAM数据集,创建于2025年,由LensAI团队精心构建,旨在通过对抗性样本的生成与利用,对深度学习模型在图像分类领域的鲁棒性进行评估与提升。该数据集基于PatchCamelyon(PCAM)图像,采用多种攻击技术生成对抗性样本,以欺骗经过微调的模型[lens-ai/clip-vit-base-patch32_pcam_finetuned]。该数据集不仅为研究人员和工程师提供了评估模型鲁棒性的工具,也用于训练更具弹性的模型,并对新的对抗性防御机制进行基准测试,对计算机视觉领域产生了深远的影响。
当前挑战
该数据集在构建过程中所面临的挑战包括:1)对抗性攻击技术的选择与应用,以确保能够有效欺骗目标模型;2)数据集结构的优化,以方便研究人员对对抗性样本、原始图像以及扰动掩码进行有效处理。在研究领域问题上,Adversarial PCAM数据集面临的挑战主要在于图像分类模型在对抗性攻击下的鲁棒性,以及如何通过训练提高模型对这类攻击的防御能力。
常用场景
经典使用场景
在深度学习与计算机视觉领域中,对抗样本的研究对于提升模型鲁棒性至关重要。Adversarial PCAM数据集便是为了评估和增强模型对抗攻击的鲁棒性而构建的。该数据集的经典使用场景在于,研究者可通过其提供的对抗样本,对预训练模型进行攻击测试,进而分析模型对于不同攻击技术的脆弱性。
解决学术问题
该数据集解决了模型在对抗攻击下鲁棒性不足的学术问题,通过提供多种攻击方法生成的对抗样本,使得研究者能够深入理解模型在面临不同攻击策略时的表现,进而指导模型设计和优化,提升模型对于实际应用中潜在攻击的防御能力。
衍生相关工作
基于Adversarial PCAM数据集,研究者已衍生出多项相关工作,包括开发新的对抗攻击方法、防御机制以及鲁棒性评估指标。这些工作进一步推动了对抗样本研究领域的进展,并为相关技术的实际应用提供了理论基础和实践指导。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作