Dataset and model files

github2021-12-10 更新2024-05-31 收录

下载链接：

https://github.com/seclab-ucr/A4

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含模型文件，用于支持论文Eluding ML-based Adblockers With Actionable Adversarial Examples中的实验和结果复现。

该数据集汇集了模型文件，旨在支持论文《绕过基于机器学习的广告拦截器：通过可操作的对抗性示例》的实验与结果再现。

创建时间：

2021-09-25

原始信息汇总

数据集概述

数据集名称

Eluding ML-based Adblockers With Actionable Adversarial Examples

数据集内容

包含用于对抗ML-based Adblockers的对抗性示例数据集和模型文件。

数据集下载

数据集文件可通过以下链接下载：Dataset and model files

数据集结构

下载后，数据集文件应放置于attack-adgraph-pipeline目录下。

数据集使用

数据集用于支持论文中的主要结果复现，特别是在Table 2中的结果。
使用数据集前，需按照README文件中的步骤进行系统设置和代理配置。

数据集分析

数据集的分析结果存储于attack-adgraph-pipeline/report目录下。
分析包括合并日志文件、统计成功与失败案例数量，并计算成功率以与论文结果对比。

搜集汇总

数据集介绍

构建方式

该数据集的构建基于对抗性攻击的研究背景，旨在通过生成可操作的对抗样本来规避基于机器学习的广告拦截器。研究者通过HTML重写技术对网页进行结构性和URL特征的扰动，模拟真实的客户端-服务器环境。数据集包含了多个版本的网页文件，包括原始版本、中心扰动版本和分布式扰动版本，并通过MITM代理服务器实现资源的正确加载。数据集的构建过程涉及多个步骤，包括下载必要的二进制文件和数据集文件、设置代理服务器以及运行攻击管道。

特点

该数据集的特点在于其多样性和实用性。首先，数据集包含了多种扰动策略生成的网页版本，能够全面反映对抗性攻击的效果。其次，数据集通过MITM代理服务器模拟真实网络环境，确保了实验结果的可靠性。此外，数据集的构建过程充分考虑了并发性，通过多实例并行运行显著减少了实验时间。最后，数据集提供了详细的日志文件，便于研究者对实验结果进行深入分析和比较。

使用方法

使用该数据集时，首先需要下载并解压相关的二进制文件和数据集文件，确保文件结构符合要求。随后，通过设置MITM代理服务器来模拟真实的网络环境，确保网页资源能够正确加载。接下来，运行攻击管道脚本，启动对抗性攻击实验。实验过程中，系统会自动生成日志文件，记录每次攻击的成功与失败情况。实验结束后，研究者可以通过分析日志文件，计算攻击的成功率，并与论文中的结果进行对比。整个使用过程需要一定的技术背景，特别是对MITM代理和Python脚本的熟悉。

背景与挑战

背景概述

该数据集名为'Dataset and model files'，主要用于研究基于机器学习的广告拦截器的规避问题。该数据集由UIowa的IRL实验室于2020年创建，旨在通过生成可操作的对抗样本来测试广告拦截器的鲁棒性。研究团队通过HTML重写技术，模拟了真实网页环境中的广告加载过程，并生成了多种对抗样本以评估广告拦截器的性能。该数据集在网络安全和机器学习领域具有重要影响力，特别是在广告拦截器的鲁棒性测试和对抗样本生成方面，为相关研究提供了宝贵的数据支持。

当前挑战

该数据集面临的挑战主要体现在两个方面。首先，在领域问题方面，广告拦截器的规避问题本身具有高度复杂性，尤其是在动态网页环境下，广告的加载和展示方式多样，如何生成有效的对抗样本以测试拦截器的鲁棒性是一个关键挑战。其次，在数据集构建过程中，研究团队需要模拟真实的客户端-服务器环境，并通过MITM代理技术实现网页资源的正确加载，这一过程涉及大量的工程化工作和技术细节，尤其是在处理相对URL和并发请求时，确保数据的一致性和准确性成为一大难题。

常用场景

经典使用场景

该数据集主要用于研究机器学习驱动的广告拦截器的脆弱性，特别是在面对对抗性样本时的表现。通过生成可操作的对抗性样本，研究者能够模拟广告拦截器在实际网络环境中的反应，进而评估其鲁棒性和安全性。这一场景为网络安全领域提供了重要的实验平台，帮助理解机器学习模型在复杂网络环境中的行为。

实际应用

在实际应用中，该数据集被广泛用于测试和优化广告拦截器的性能。通过模拟真实的网络环境，开发者能够识别和修复广告拦截器中的潜在漏洞，从而提高其在实际使用中的效果和可靠性。此外，该数据集还为网络安全公司提供了宝贵的实验数据，帮助其开发更强大的防御机制。

衍生相关工作

基于该数据集，研究者们已经开展了多项相关工作，包括开发新的对抗性样本生成技术、改进广告拦截器的鲁棒性评估方法，以及探索机器学习模型在网络安全中的其他应用。这些工作不仅扩展了对抗性机器学习的研究范围，还为实际应用中的网络安全问题提供了新的解决方案。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集