BackdoorBench

Name: BackdoorBench
Creator: 香港中文大学（深圳）数据科学学院
Published: 2024-07-29 17:57:03
License: 暂无描述

arXiv2024-07-29 更新2024-06-21 收录

下载链接：

http://backdoorbench.com

下载链接

链接失效反馈

官方服务：

资源简介：

BackdoorBench是由香港中文大学（深圳）数据科学学院创建的一个全面的后门学习基准数据集。该数据集包含11,492条攻击-防御评估对，涵盖4个模型和4个数据集，旨在评估和分析后门学习算法的性能。数据集的创建过程遵循标准化协议，确保评估的公平性和可重复性。BackdoorBench主要应用于对抗机器学习和可信机器学习领域，旨在促进新算法的设计和后门学习内在机制的探索。

BackdoorBench is a comprehensive benchmark dataset for backdoor learning, created by the School of Data Science, The Chinese University of Hong Kong, Shenzhen. It contains 11,492 attack-defense evaluation pairs covering 4 models and 4 datasets, aiming to evaluate and analyze the performance of backdoor learning algorithms. The dataset is constructed in accordance with standardized protocols to ensure the fairness and reproducibility of evaluations. BackdoorBench is primarily applied in the fields of adversarial machine learning and trustworthy machine learning, with the goal of facilitating the design of novel algorithms and the exploration of the inherent mechanisms of backdoor learning.

提供机构：

香港中文大学（深圳）数据科学学院

创建时间：

2024-07-29

搜集汇总

数据集介绍

构建方式

BackdoorBench 是一个针对后门学习（backdoor learning）的全面基准测试数据集，旨在解决当前后门学习研究中存在的标准化和公平比较问题。该数据集的构建基于一个可扩展的模块化代码库，包括攻击模块、防御模块、评估和分析模块。目前，BackdoorBench 已实现 16 种最先进的后门攻击算法和 27 种防御算法。数据集的构建方式是通过对现有后门攻击和防御算法进行综合评估，包括 12 种攻击方法针对 16 种防御方法的评估，基于 4 种模型和 4 个数据集，共 11,492 对评估。此外，BackdoorBench 还提供了丰富的分析工具，从 8 个不同的角度对后门学习进行了深入分析。

特点

BackdoorBench 的主要特点是全面性、公平性和标准化。首先，数据集涵盖了当前最先进的后门攻击和防御算法，能够全面反映后门学习的现状。其次，数据集的评估过程采用了标准化的协议，确保了评估的公平性和可重复性。最后，数据集还提供了丰富的分析工具，能够从多个角度对后门学习进行深入分析，为研究人员提供了宝贵的参考。

使用方法

使用 BackdoorBench 数据集的方法包括以下步骤：首先，从 BackdoorBench 网站下载相关代码和数据；其次，根据数据集的协议进行数据准备和预处理；然后，选择合适的后门攻击和防御算法进行实验；接着，使用数据集提供的评估指标进行结果评估；最后，利用数据集提供的分析工具进行深入分析，以揭示后门学习的内在机制。BackdoorBench 数据集的使用将有助于研究人员更好地理解和研究后门学习，推动相关技术的发展。

背景与挑战

背景概述

随着深度神经网络（DNNs）在众多关键任务场景中的广泛应用，其安全性问题日益受到关注。后门学习作为一种典型的安全威胁，通过恶意篡改训练数据或控制训练过程，将难以察觉的后门植入模型中，给广泛采用的数据集/模型下载、训练/微调模式或第三方训练平台外包带来了严重威胁。BackdoorBench数据集由香港中文大学（深圳）数据科学学院的研究团队于2021年创建，旨在建立一个全面的基准，以评估和促进后门学习领域的研究。该数据集整合了16种先进的后门攻击算法和27种先进的防御算法，并提供了18种分析工具，以帮助研究人员从8个不同的角度深入分析后门学习。BackdoorBench的创建为后门学习领域的研究提供了坚实的基础，促进了现有算法的研究、新算法的开发以及对后门学习内在机制的探索。

当前挑战

BackdoorBench数据集面临着一些挑战，包括：1)后门攻击和防御算法的多样性设置和实现困难导致缺乏统一的基准，使得公平比较和可靠结论难以得出；2)后门攻击和防御算法的快速发展导致新方法的评估往往不足，缺乏与有限的前置方法、模型和数据的比较；3)后门攻击和防御算法对超参数的敏感性，使得算法的性能和泛化能力难以验证；4)后门攻击和防御算法的学习过程，包括数据、模型结构、算法和超参数等方面，需要深入分析和探索。

常用场景

经典使用场景

BackdoorBench 数据集主要用于深度神经网络（DNNs）的后门学习研究，特别是后门攻击和防御算法的评估。该数据集提供了一个统一的、标准化的平台，使得研究人员可以公平地比较不同的攻击和防御方法，并在此基础上设计新的算法，探索后门学习的内在机制。

实际应用

BackdoorBench 数据集的实际应用场景包括但不限于以下几个方面：1) 评估和比较不同的后门攻击和防御算法，从而为实际应用中选择合适的算法提供参考；2) 设计和开发新的后门攻击和防御算法，以应对不断变化的威胁；3) 研究后门学习的内在机制，从而提高深度神经网络的安全性。

衍生相关工作

BackdoorBench 数据集的建立为后门学习研究提供了重要的基础，并衍生出了许多相关的经典工作。例如，基于 BackdoorBench 数据集，研究人员可以设计新的后门攻击和防御算法，并进行深入的实验分析。此外，BackdoorBench 数据集还可以用于研究后门学习的内在机制，从而提高深度神经网络的安全性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集