GTSRB, CIFAR-10
收藏github2025-03-03 更新2025-02-20 收录
下载链接:
https://github.com/NcepuQiaoTing/CertDW
下载链接
链接失效反馈官方服务:
资源简介:
GTSRB是一个交通标志识别数据集,CIFAR-10是一个用于图像识别的常用数据集。
The Gtsrb and Cifar10 datasets are employed for the training and validation of models.
创建时间:
2025-02-18
原始信息汇总
CertDW 数据集概述
数据集简介
- 名称:CertDW
- 用途:用于验证数据集所有权的工具,基于Conformal Prediction方法
- 创建者:Ting Qiao, Yiming Li等
- 开发语言:Python 3.8, Pytorch
引用信息
@article{Qiao2025certdw, title={CertDW: Towards Certified Dataset Ownership Verification via Conformal Prediction}, author={Ting Qiao, Jianbin Li, Yiming Li, Yingjia Wang, Leyi Qi, Junfeng Guo, Ruili Feng, Dacheng Tao}, journal={arXiv preprint arXiv:}, year={2025} }
目录结构
dataGtsrb:包含训练集和测试集Cifar10:包含训练集和测试集
train_benigntrain_watermarktrain_indenpendentnetworkmodelbenignwatermarkedindependent
数据集准备
模型准备
- 模型下载链接
训练模型
- 训练良性模型
- Gtsrb:
python train_benign.py --dataset gtsrb - Cifar10:
python train_benign.py --dataset cifar10
- Gtsrb:
- 训练水印模型
- Gtsrb:
python train_watermark.py --dataset gtsrb --watermark badnets - Cifar10:
python train_watermark.py --dataset cifar10
- Gtsrb:
- 训练独立模型
- Gtsrb:
python train_indenpendent.py --dataset gtsrb - Cifar10:
python train_indenpendent.py --dataset cifar10
- Gtsrb:
数据集所有权验证
- 验证命令
- Gtsrb:
python ownership_verification.py --dataset gtsrb --sigma 2.5 --watermark badnets - Cifar10:
python ownership_verification.py --dataset cifar10 --sigma 1.2 --watermark badnets
- Gtsrb:
验证结果示例
python ownership_verification.py --dataset gtsrb --sigma 2.5 --watermark badnets
result: VSR: 72% WCA:48%
搜集汇总
数据集介绍

构建方式
Gtsrb与Cifar10数据集是本研究项目的一部分,旨在通过符合性预测实现数据集所有权的认证。该数据集的构建遵循了Python 3.8和Pytorch框架,并通过特定脚本对数据进行了训练与水印处理,形成了良性疾病模型、水印模型和独立模型三种类型的数据集。
使用方法
使用该数据集时,用户需根据具体需求选择相应的模型进行训练。良性疾病模型和独立模型的训练可通过指定的脚本进行,而水印模型则需选择不同的水印类型进行训练。完成训练后,用户可通过所有权验证脚本对可疑模型进行所有权验证,以判断其是否在受保护的数据集上进行了训练。
背景与挑战
背景概述
Gtsrb与Cifar10数据集在本研究项目中作为核心实验数据集,其研究背景源于对数据集所有权的认证问题。该研究项目基于Python 3.8和Pytorch,由Ting Qiao与Yiming Li共同开发,旨在通过符合预测的方式实现对数据集所有权的认证。该研究对于数据安全与版权保护领域具有重要意义,为相关领域的研究提供了新的视角和方法。
当前挑战
该数据集在研究领域中面临的挑战主要包括:一是如何在保证数据隐私的前提下,有效验证数据集的所有权;二是构建过程中,如何处理水印模型与良性模型之间的关联性,以及如何确保水印模型的不可感知性和稳健性。此外,数据集在分类准确性、泛化能力以及对抗攻击方面的性能也是当前研究的重要挑战。
常用场景
经典使用场景
Gtsrb与Cifar10数据集在本研究中作为核心资源,其经典使用场景在于为深度学习模型训练提供标准化的图像数据。Gtsrb数据集包含交通信号识别图像,而Cifar10则涵盖多种日常用品的图片,两者均被用于训练模型以识别和区分不同的类别。
解决学术问题
该数据集解决了学术研究中模型泛化能力验证和模型训练数据来源的可验证性问题。CertDW方案通过在数据集中引入水印,并利用符合预测进行数据集所有权的验证,从而提高了学术研究中数据集使用的安全性,确保了研究成果的可信度和可重复性。
实际应用
在现实应用中,Gtsrb与Cifar10数据集的这种使用方式有助于提高图像分类模型的鲁棒性,并在数据安全领域提供了新的数据验证方法。例如,在自动驾驶系统中,利用这种验证方式可以确保系统所使用的训练数据未被篡改,从而提高系统的安全性和可靠性。
数据集最近研究
最新研究方向
在数据安全与隐私保护领域,Gtsrb与Cifar10数据集被应用于一项名为CertDW的研究中,该研究旨在通过符合预测方法实现数据集所有权的认证。此研究针对数据集所有权验证问题,提出了一种新型的认证机制,保障了数据集的安全性和所有权归属,对于防止数据泄露和非法使用具有重要的研究价值和实际意义。
以上内容由遇见数据集搜集并总结生成



