DATABENCH
收藏DATABench 数据集概述
基本描述
DATABench是一个用于从对抗角度评估深度学习数据集审计方法的综合基准。它提供了标准化接口的统一框架,支持对数据集审计算法和潜在攻击进行公平比较和可扩展研究。
主要特性
- 统一评估框架:为对抗环境下的数据集审计方法提供标准化评估流程
- 可扩展架构:明确定义的接口支持实现新的审计算法和攻击方法
- 三阶段攻击流程:包含预处理、训练和后处理阶段的全面攻击框架
- ImageFolder支持:兼容任何ImageFolder结构的数据集
- 丰富攻击方法:内置多种攻击包括过滤、差分隐私、对抗训练和混合方法
- 多种审计技术:支持MIA、DVBW、DW等多种审计方法
项目结构
DATABench/ ├── audit/ # 数据集审计实现 │ ├── dataset_audit.py # 基础审计接口 │ ├── MIA.py # 成员推理攻击 │ ├── DVBW.py # 通过后门水印进行数据集所有权验证 │ └── ... # 其他审计方法 ├── attack/ # 攻击实现 │ ├── attack_interface.py # 基础攻击接口 │ ├── attack.py # 攻击工厂和配置 │ ├── preprocessing/ # 预处理攻击 │ ├── training/ # 训练时攻击 │ └── postprocessing/ # 后处理攻击 ├── config/ # 配置文件 ├── scripts/ # 评估脚本 ├── utils/ # 实用函数 └── audit_main.py # 主评估脚本
快速开始
-
环境准备: bash pip install -r requirements.txt
-
数据集准备(以CIFAR-10为例): bash python utils/transform_cifar10.py
-
执行评估: bash bash scripts/audit/DVBW/resnet18-cifar10.sh ${gpus} ${attack} # 用于规避攻击 bash scripts/forgery/forgery.sh ${gpus} ${audit_method} # 用于伪造攻击
相关论文
- 标题:DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective
- 作者:Shao, Shuo等
- 期刊:arxiv preprint arxiv:2507.05622
- 年份:2025




