five

Dataset and model files

收藏
github2021-12-10 更新2024-05-31 收录
下载链接:
https://github.com/seclab-ucr/A4
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含模型文件,用于支持论文Eluding ML-based Adblockers With Actionable Adversarial Examples中的实验和结果复现。

该数据集汇集了模型文件,旨在支持论文《绕过基于机器学习的广告拦截器:通过可操作的对抗性示例》的实验与结果再现。
创建时间:
2021-09-25
原始信息汇总

数据集概述

数据集名称

  • Eluding ML-based Adblockers With Actionable Adversarial Examples

数据集内容

  • 包含用于对抗ML-based Adblockers的对抗性示例数据集和模型文件。

数据集下载

数据集结构

  • 下载后,数据集文件应放置于attack-adgraph-pipeline目录下。

数据集使用

  • 数据集用于支持论文中的主要结果复现,特别是在Table 2中的结果。
  • 使用数据集前,需按照README文件中的步骤进行系统设置和代理配置。

数据集分析

  • 数据集的分析结果存储于attack-adgraph-pipeline/report目录下。
  • 分析包括合并日志文件、统计成功与失败案例数量,并计算成功率以与论文结果对比。
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对抗性攻击的研究背景,旨在通过生成可操作的对抗样本来规避基于机器学习的广告拦截器。研究者通过HTML重写技术对网页进行结构性和URL特征的扰动,模拟真实的客户端-服务器环境。数据集包含了多个版本的网页文件,包括原始版本、中心扰动版本和分布式扰动版本,并通过MITM代理服务器实现资源的正确加载。数据集的构建过程涉及多个步骤,包括下载必要的二进制文件和数据集文件、设置代理服务器以及运行攻击管道。
特点
该数据集的特点在于其多样性和实用性。首先,数据集包含了多种扰动策略生成的网页版本,能够全面反映对抗性攻击的效果。其次,数据集通过MITM代理服务器模拟真实网络环境,确保了实验结果的可靠性。此外,数据集的构建过程充分考虑了并发性,通过多实例并行运行显著减少了实验时间。最后,数据集提供了详细的日志文件,便于研究者对实验结果进行深入分析和比较。
使用方法
使用该数据集时,首先需要下载并解压相关的二进制文件和数据集文件,确保文件结构符合要求。随后,通过设置MITM代理服务器来模拟真实的网络环境,确保网页资源能够正确加载。接下来,运行攻击管道脚本,启动对抗性攻击实验。实验过程中,系统会自动生成日志文件,记录每次攻击的成功与失败情况。实验结束后,研究者可以通过分析日志文件,计算攻击的成功率,并与论文中的结果进行对比。整个使用过程需要一定的技术背景,特别是对MITM代理和Python脚本的熟悉。
背景与挑战
背景概述
该数据集名为'Dataset and model files',主要用于研究基于机器学习的广告拦截器的规避问题。该数据集由UIowa的IRL实验室于2020年创建,旨在通过生成可操作的对抗样本来测试广告拦截器的鲁棒性。研究团队通过HTML重写技术,模拟了真实网页环境中的广告加载过程,并生成了多种对抗样本以评估广告拦截器的性能。该数据集在网络安全和机器学习领域具有重要影响力,特别是在广告拦截器的鲁棒性测试和对抗样本生成方面,为相关研究提供了宝贵的数据支持。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,在领域问题方面,广告拦截器的规避问题本身具有高度复杂性,尤其是在动态网页环境下,广告的加载和展示方式多样,如何生成有效的对抗样本以测试拦截器的鲁棒性是一个关键挑战。其次,在数据集构建过程中,研究团队需要模拟真实的客户端-服务器环境,并通过MITM代理技术实现网页资源的正确加载,这一过程涉及大量的工程化工作和技术细节,尤其是在处理相对URL和并发请求时,确保数据的一致性和准确性成为一大难题。
常用场景
经典使用场景
该数据集主要用于研究机器学习驱动的广告拦截器的脆弱性,特别是在面对对抗性样本时的表现。通过生成可操作的对抗性样本,研究者能够模拟广告拦截器在实际网络环境中的反应,进而评估其鲁棒性和安全性。这一场景为网络安全领域提供了重要的实验平台,帮助理解机器学习模型在复杂网络环境中的行为。
实际应用
在实际应用中,该数据集被广泛用于测试和优化广告拦截器的性能。通过模拟真实的网络环境,开发者能够识别和修复广告拦截器中的潜在漏洞,从而提高其在实际使用中的效果和可靠性。此外,该数据集还为网络安全公司提供了宝贵的实验数据,帮助其开发更强大的防御机制。
衍生相关工作
基于该数据集,研究者们已经开展了多项相关工作,包括开发新的对抗性样本生成技术、改进广告拦截器的鲁棒性评估方法,以及探索机器学习模型在网络安全中的其他应用。这些工作不仅扩展了对抗性机器学习的研究范围,还为实际应用中的网络安全问题提供了新的解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作