n1ghtf4l1/vigilant-fortnight
收藏Hugging Face2022-11-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/n1ghtf4l1/vigilant-fortnight
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于NeurIPS 2022 Trojan Detection Challenge竞赛,旨在检测和分析深度神经网络中的木马攻击。数据集包含三个主要赛道:木马检测、木马分析和逃避木马。木马检测赛道的任务是分类木马和干净的网络;木马分析赛道包括目标标签预测和触发器合成两个子任务;逃避木马赛道的任务是训练难以检测的木马网络。数据集由神经网络组成,这些网络在MNIST、CIFAR-10、CIFAR-100和GTSRB等标准数据源上训练。数据集中的木马攻击是经过修改的,使其更难被检测。README文件还提供了如何使用数据集的详细说明,包括如何下载数据集、运行示例代码以及使用辅助函数。
This dataset is developed for the NeurIPS 2022 Trojan Detection Challenge, which focuses on detecting and analyzing trojan attacks in deep neural networks. The dataset includes three primary tracks: trojan detection, trojan analysis, and trojan evasion. The trojan detection track aims to classify trojan-infected neural networks versus clean ones; the trojan analysis track encompasses two subtasks: target label prediction and trigger synthesis; the trojan evasion track requires training trojan-infected networks that are hard to detect. The dataset consists of neural networks trained on standard benchmark datasets including MNIST, CIFAR-10, CIFAR-100, and GTSRB. The trojan attacks in this dataset have been modified to be more difficult to detect. The accompanying README file also provides detailed instructions on how to use the dataset, including how to download the dataset, run sample code, and utilize auxiliary functions.
提供机构:
n1ghtf4l1
原始信息汇总
数据集概述
数据集名称
Trojan Detection Challenge (TDC) NeurIPS 2022
数据集内容
- 数据类型: 神经网络模型
- 数据来源: MNIST, CIFAR-10, CIFAR-100, GTSRB
- 攻击类型: 基于BadNets和blended攻击的变种,通过微调从干净网络开始的参数并使用各种相似性损失进行正则化,使得这些攻击更难以检测。
数据集结构
- Trojan Detection Track: 包含1000个神经网络模型,其中500个被植入木马,500个为干净网络。
- Trojan Analysis Track: 包含两个子轨道:(1) 目标标签预测,(2) 触发器合成。
- Evasive Trojans Track: 提供干净网络和攻击规范列表,参与者需训练符合规范的木马网络。
数据集使用
- 下载方式: 通过Zenodo网站或运行
download_datasets.py脚本下载。 - 数据存储: 数据集存储在
tdc_datasets文件夹中,与tdc-starter-kit位于同一父目录下。
数据集特征
- 网络类型: 针对不同数据源使用不同的网络架构,如Wide Residual Networks用于CIFAR-10和CIFAR-100,Vision Transformers用于GTSRB。
- 攻击特征: 使用随机触发模式,每个攻击使用不同的位置和大小触发掩码。
数据集许可证
MIT许可证
搜集汇总
数据集介绍

构建方式
在人工智能安全领域,神经网络木马检测日益成为关键议题。该数据集专为NeurIPS 2022木马检测挑战赛构建,其核心在于模拟真实场景中的隐蔽木马攻击。构建过程采用了四种标准数据源——MNIST、CIFAR-10、CIFAR-100和GTSRB,并基于这些数据训练了共计三千个神经网络模型,其中半数被植入了木马。木马攻击设计为两种变体:补丁攻击和混合攻击,均经过精心改良以提升隐蔽性。具体而言,攻击并非从头训练,而是通过对清洁网络参数进行微调,并引入相似性损失正则化,使被感染网络在分布上接近清洁网络,同时确保攻击对特定触发模式具有高特异性,从而极大增加了检测难度。
使用方法
为有效利用该数据集进行安全研究,用户需首先克隆相关代码库并从指定平台下载数据集文件,确保其与代码库处于同级目录。使用前应配置兼容的PyTorch 1.11.0环境,并更新Jupyter版本以避免兼容性问题。数据加载依赖于附带的工具函数,可便捷读取不同数据源的网络模型;对于GTSRB数据,需额外解压预处理文件。研究者可遵循示例提交笔记本的指引,基于训练集与验证集开发木马检测或分析模型,最终在测试集上评估性能。数据集支持构建新型检测器以超越MNTD、神经净化等基线方法,亦可用于探索高隐蔽性木马的生成与对抗策略,推动防御技术的实质性进展。
背景与挑战
背景概述
随着深度学习模型在安全关键领域的广泛应用,神经网络后门攻击(Trojan Attack)已成为机器学习安全领域的重要威胁。为系统评估防御机制的有效性,NeurIPS 2022会议推出了Trojan Detection Challenge竞赛,并发布了n1ghtf4l1/vigilant-fortnight数据集。该数据集由竞赛组织者构建,聚焦于检测深度神经网络中的隐蔽后门,其核心研究问题在于揭示后门攻击与防御之间的根本平衡关系。通过整合多数据源和增强型攻击变体,该数据集推动了对抗性机器学习领域的前沿探索,为构建可信赖的人工智能系统提供了关键基准。
当前挑战
该数据集旨在解决神经网络后门检测这一复杂安全问题的挑战,其核心难点在于识别经过精心设计、难以察觉的隐蔽后门。具体而言,挑战体现在两个方面:其一,在领域问题层面,后门攻击具有高度隐蔽性和特异性,攻击者通过微调模型参数并施加相似性约束,使受感染模型在正常输入上表现无异,仅在特定触发模式出现时才执行恶意行为,这导致传统检测方法如MNTD、Neural Cleanse等基线检测器性能显著下降。其二,在构建过程中,数据集需模拟真实世界的攻击多样性,涵盖MNIST、CIFAR-10、CIFAR-100和GTSRB等多种数据源,并设计包括补丁攻击和混合攻击在内的增强型变体,同时确保攻击的随机性和目标标签的不可预测性,以全面评估防御算法的鲁棒性。
常用场景
经典使用场景
在机器学习安全领域,神经网络后门攻击已成为一个日益严峻的威胁,而n1ghtf4l1/vigilant-fortnight数据集作为NeurIPS 2022 Trojan Detection Challenge的核心资源,为研究者提供了评估和开发后门检测算法的标准化平台。该数据集包含在MNIST、CIFAR-10、CIFAR-100和GTSRB等经典视觉任务上训练的干净与受感染的神经网络模型,其中后门攻击经过精心设计以增强隐蔽性,如通过微调和相似性损失正则化来模拟干净网络的分布特征。这使得数据集成为验证检测方法在复杂对抗环境下的鲁棒性的理想基准,尤其适用于比较不同检测策略在识别隐藏恶意功能方面的效能。
解决学术问题
该数据集直接应对机器学习安全中的核心学术挑战:后门攻击的检测与防御平衡问题。传统研究往往基于简单攻击假设,而实际中攻击者可能设计出近乎不可检测的后门,导致安全评估存在偏差。通过提供多样化的数据源、攻击类型(如补丁攻击和混合攻击)以及经过优化的隐蔽后门模型,数据集促进了对于后门攻击本质的深入探索,帮助研究者量化检测极限,并推动开发更通用的防御理论。其意义在于为后门检测领域建立了可重复的实验框架,加速了从理论到实践的转化,为构建可信赖的机器学习系统奠定了实证基础。
实际应用
在实际应用中,该数据集支撑了关键安全系统的评估与优化,特别是在自动驾驶、医疗影像分析和金融风控等高风险领域。例如,在自动驾驶视觉系统中,后门攻击可能导致模型在特定触发条件下错误识别交通标志,从而引发安全事故。利用该数据集,工程师可以测试现有检测工具(如MNTD、Neural Cleanse)的可靠性,并开发定制化防御方案,确保部署前的模型安全性。此外,数据集还用于培训安全专业人员,提升他们对新兴威胁的识别能力,最终促进工业界采纳更严格的模型审计流程,降低实际部署中的安全风险。
数据集最近研究
最新研究方向
在人工智能安全领域,针对深度神经网络中隐蔽性特洛伊木马攻击的检测与防御已成为前沿热点。该数据集源自NeurIPS 2022特洛伊检测挑战赛,聚焦于构建能够识别经过精细伪装的特洛伊模型的先进方法。当前研究不仅关注传统检测技术,更深入探索对抗性特洛伊的生成机制,旨在通过触发模式合成与目标标签预测等多维度分析,提升模型在复杂攻击场景下的鲁棒性。相关进展正推动机器学习系统安全评估范式的革新,为高可靠性人工智能应用奠定理论基础。
以上内容由遇见数据集搜集并总结生成



