five

YouTube Face dataset

收藏
github2023-12-04 更新2024-05-31 收录
下载链接:
https://github.com/ali-rasteh/Deep_learning_backdoor_defense
下载链接
链接失效反馈
官方服务:
资源简介:
用于训练深度神经网络的YouTube人脸数据集,该数据集被用于防御针对深度神经网络的后门攻击,通过通道剪枝技术实现防御。

A YouTube face dataset for training deep neural networks, utilized for defending against backdoor attacks targeting deep neural networks, achieved through channel pruning techniques.
创建时间:
2023-12-04
原始信息汇总

数据集概述

数据集内容

  • 清洁验证数据:位于data/cl/valid.h5,用于设计防御策略。
  • 清洁测试数据:位于data/cl/test.h5,用于评估BadNet。
  • 中毒验证数据:位于data/bd/bd_valid.h5,包含太阳镜中毒数据。
  • 中毒测试数据:位于data/bd/bd_test.h5,包含太阳镜中毒数据。

数据用途

  • 清洁验证数据:用于修复网络并创建修剪后的最终良好网络。
  • 清洁和中毒测试数据:用于评估修复模型的性能。

模型概述

  • bd_net.h5:需要修剪的初始BadNet模型。
  • PrunedNet_X-2.keras, PrunedNet_X-4.keras, PrunedNet_X-10.keras:修剪后的网络,通过移除pool_3层中的部分通道,使验证数据上的准确率分别下降2%、4%和10%。
  • GoodNet_X-2.keras, GoodNet_X-4.keras, GoodNet_X-10.keras:修复后的良好网络,当输出与BadNet和修剪网络相同时输出同一类别,否则输出新增类别(N+1)。

评估方法

  • 修剪BadNet:通过运行repair.py,使用清洁验证数据对BadNet进行修剪。
  • 评估中毒模型:通过运行eval.py,使用清洁和中毒测试数据评估模型的分类准确率和攻击成功率。
搜集汇总
数据集介绍
main_image_url
构建方式
YouTube Face数据集的构建过程主要围绕对抗性攻击与防御的研究展开。数据集分为干净数据和中毒数据两部分,干净数据用于模型修复与验证,中毒数据则用于评估模型在面对对抗性攻击时的表现。数据以HDF5格式存储,便于高效读取与处理。模型的构建与修复过程通过Keras框架实现,结合了TensorFlow的GPU加速功能,确保了计算效率。
特点
该数据集的特点在于其专注于对抗性攻击场景下的模型性能评估。数据集不仅提供了干净数据,还包含了经过特定攻击(如太阳镜中毒)处理的中毒数据,能够全面评估模型在正常与异常情况下的表现。此外,数据集还提供了多种修剪后的模型版本(如PrunedNet和GoodNet),这些模型通过不同程度的修剪与修复,展示了模型在面对对抗性攻击时的鲁棒性与修复效果。
使用方法
使用该数据集时,首先需下载并存储验证与测试数据至指定目录。通过运行`repair.py`脚本,用户可以对给定的中毒模型进行修剪与修复,生成不同修剪程度的模型。随后,使用`eval.py`脚本对修复后的模型进行评估,输出模型在干净数据与中毒数据上的分类准确率与攻击成功率。整个过程依赖于Python 3.6.9、Keras 2.3.1、TensorFlow-gpu 1.15.2等工具,确保了实验的可重复性与高效性。
背景与挑战
背景概述
YouTube Face数据集是一个专注于人脸识别与安全性的重要数据集,由研究团队在深度学习与网络安全领域的研究中创建。该数据集的核心研究问题在于如何检测和防御深度学习模型中的后门攻击(Backdoor Attack),特别是在人脸识别系统中。通过提供干净数据和被污染的数据,该数据集为研究人员提供了一个实验平台,用于开发和评估防御机制。其影响力不仅限于人脸识别领域,还扩展到了深度学习模型的安全性与鲁棒性研究,推动了相关领域的技术进步。
当前挑战
YouTube Face数据集面临的主要挑战包括两个方面。首先,在领域问题方面,如何有效检测和防御深度学习模型中的后门攻击是一个复杂且具有挑战性的任务。后门攻击通过在训练数据中植入特定触发器,使得模型在特定输入下产生错误输出,而这一行为在正常输入下难以察觉。其次,在数据集构建过程中,研究人员需要精确控制数据污染的程度,以确保实验结果的可靠性和可重复性。同时,如何设计有效的修复算法(如剪枝技术)以在不显著降低模型性能的前提下消除后门,也是一个技术难点。这些挑战共同推动了深度学习安全领域的研究与发展。
常用场景
经典使用场景
YouTube Face数据集在深度学习和计算机视觉领域中被广泛用于面部识别和面部表情分析的研究。该数据集包含大量从YouTube视频中提取的面部图像,涵盖了不同光照条件、姿态和表情的变化,为研究者提供了一个丰富且多样化的实验平台。通过该数据集,研究者可以训练和评估各种面部识别算法,尤其是在复杂背景和动态环境下的性能表现。
衍生相关工作
基于YouTube Face数据集,研究者们提出了多种经典的面部识别和表情分析算法。例如,一些工作利用该数据集开发了基于深度卷积神经网络的面部识别模型,显著提升了识别精度。此外,该数据集还催生了许多关于对抗性攻击和防御的研究,特别是在后门攻击检测和修复方面,提出了多种有效的防御策略,如网络剪枝和模型修复技术。
数据集最近研究
最新研究方向
YouTube Face数据集近年来在深度学习安全领域引起了广泛关注,尤其是在对抗性攻击与防御机制的研究中。该数据集通过提供干净和被污染(如太阳镜中毒)的验证与测试数据,为研究者提供了一个理想的实验平台,用于探索神经网络在面对后门攻击时的脆弱性及其修复策略。当前的研究热点集中在如何通过剪枝技术(如PrunedNet系列模型)和修复网络(如GoodNet系列模型)来有效抵御后门攻击,同时保持模型在干净数据上的高精度。这些研究不仅推动了深度学习模型的安全性评估方法的发展,也为实际应用中如何构建鲁棒的神经网络提供了重要的理论支持和技术参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作