Probing Dataset

github2024-03-23 更新2024-05-31 收录

下载链接：

https://github.com/gubertoli/ProbingDataset

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集包含使用nmap、unicornscan、hping3、zmap和masscan执行的探测攻击（端口扫描）数据。此外，还提供了一种提取背景流量作为“正常”流量以支持IDS研究中机器学习算法开发的方法。

This dataset encompasses data from probing attacks (port scans) conducted using nmap, unicornscan, hping3, zmap, and masscan. Additionally, it provides a methodology for extracting background traffic as 'normal' traffic to support the development of machine learning algorithms in IDS research.

创建时间：

2019-10-07

原始信息汇总

Probing Dataset 概述

数据集内容

攻击类型：端口扫描攻击（Port Scan）
工具使用：nmap, unicornscan, hping3, zmap, masscan
数据集组成：包含恶意攻击数据集和正常流量数据集
- 恶意攻击数据集：通过虚拟机基础设施生成
- 正常流量数据集：通过MAWILab数据集生成

数据集用途

支持入侵检测系统（IDS）研究中的机器学习算法开发

引用信息

作者：Gustavo de Carvalho Bertoli, Lourenço Alves Pereira Júnior, Filipe Alves Neto Verri, Osamu Saotome
版本：v1.0.0
数据集链接：Probing Dataset

搜集汇总

数据集介绍

构建方式

Probing Dataset的构建过程主要依赖于多种网络扫描工具，包括nmap、unicornscan、hping3、zmap和masscan，这些工具被用于生成探测攻击（Port Scan）的数据。同时，为了支持入侵检测系统（IDS）研究中机器学习算法的开发，该数据集还从MAWILab数据集中提取了背景流量作为正常流量。通过虚拟机基础设施和脚本的配合，确保了数据的多样性和真实性。

使用方法

Probing Dataset的使用方法较为灵活，用户可以通过提供的虚拟机基础设施和脚本，重现数据集的生成过程，或直接使用已生成的数据进行实验。该数据集特别适用于开发与评估网络入侵检测系统中的机器学习算法。用户可以根据需要，将攻击流量与正常流量结合，构建训练集和测试集，从而验证模型的检测能力与鲁棒性。此外，数据集还提供了详细的参考文献和引用信息，便于用户进一步了解其背景与应用场景。

背景与挑战

背景概述

Probing Dataset 是由 Gustavo de Carvalho Bertoli 等研究人员于2019年创建的一个专注于网络入侵检测系统（IDS）研究的数据集。该数据集主要针对探测攻击（如端口扫描）的模拟，使用了多种工具如 nmap、unicornscan、hping3、zmap 和 masscan 来生成恶意流量。同时，数据集还提供了从 MAWILab 数据集中提取的正常流量数据，以支持机器学习算法在 IDS 领域的开发。该数据集的创建旨在为网络安全的自动化异常检测和性能评估提供可靠的数据支持，推动了网络入侵检测技术的研究与应用。

当前挑战

Probing Dataset 在解决网络入侵检测领域的挑战时，面临的主要问题是如何有效区分正常流量与恶意流量，尤其是在复杂的网络环境中。探测攻击的多样性和隐蔽性使得传统的检测方法难以应对，而机器学习算法的引入则需要高质量的训练数据。在数据集的构建过程中，研究人员需要克服生成真实恶意流量的技术难题，同时确保正常流量的多样性和代表性。此外，数据集的标注和验证过程也面临挑战，需要结合多种异常检测器进行自动化标注和性能评估，以确保数据的准确性和可靠性。

常用场景

经典使用场景

Probing Dataset在网络安全领域中被广泛应用于模拟和分析探测攻击（如端口扫描）的行为模式。通过使用nmap、unicornscan、hping3、zmap和masscan等工具生成的恶意流量数据，研究人员能够深入理解攻击者的策略和技术，从而为入侵检测系统（IDS）的开发和优化提供有力支持。

解决学术问题

该数据集为网络安全研究中的探测攻击检测提供了标准化的数据基础，解决了传统研究中缺乏真实攻击流量数据的难题。通过结合MAWILab数据集生成的正常流量数据，研究人员能够更准确地训练和评估机器学习模型，提升入侵检测系统的检测精度和鲁棒性。

实际应用

在实际应用中，Probing Dataset被广泛用于企业网络的安全防护系统开发和测试。通过模拟真实的探测攻击场景，企业能够评估其网络防御系统的有效性，并针对潜在威胁进行优化。此外，该数据集还被用于网络安全培训和教育，帮助安全从业人员提升对探测攻击的识别和应对能力。

数据集最近研究