UNSW-NB15

github2024-05-21 更新2024-05-31 收录

下载链接：

https://github.com/haeun161/GAN_DataAugmentation-UNSW_NB15_Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

UNSW-NB15是一个网络入侵数据集，包含九种不同的攻击，如DoS、蠕虫、后门和模糊测试器。数据集包含原始网络数据包，训练集有175,341条记录，测试集有82,332条记录，涵盖不同类型的攻击和正常数据。

The UNSW-NB15 is a network intrusion dataset that encompasses nine distinct types of attacks, including DoS, worms, backdoors, and fuzzers. The dataset comprises raw network packets, with the training set containing 175,341 records and the test set containing 82,332 records, covering various types of attacks as well as normal data.

创建时间：

2024-05-17

原始信息汇总

数据集概述

数据集名称

UNSW-NB15

数据集描述

类型：网络入侵数据集
包含攻击类型：DoS, 蠕虫, 后门, 模糊测试等九种攻击
数据内容：原始网络数据包
数据集划分：
- 训练集：175,341条记录
- 测试集：82,332条记录

数据集用途

用于模型比较研究，包括SMOTE和GAN数据增强方法的对比。

数据集处理与模型应用

数据增强方法：
- SMOTE数据增强
- GAN数据增强
模型优化策略：
- 安全相关特征消除：在训练过程中移除某些安全相关的特征以增强安全性。
模型评估指标：
- 数据增强x：
  - 训练准确率：99.9045918367347
  - 测试准确率：85.42678571428571
- GAN与SMOTE数据增强：
  - 评估指标：准确率, 内存使用, 耗时
- 安全相关特征消除后的GAN与SMOTE数据增强：
  - 评估指标：准确率, 内存使用, 耗时

数据集使用方法

数据集格式：预处理后的dataset.csv
运行命令：python main.py

搜集汇总

数据集介绍

构建方式

UNSW-NB15数据集的构建基于网络入侵检测的需求，包含了九种不同的攻击类型，如DoS、蠕虫、后门和模糊测试。数据集由原始网络数据包组成，分为训练集和测试集，分别包含175,341条和82,332条记录。构建过程中，特别关注了数据类别的不平衡问题，通过数据增强技术如SMOTE和GAN来平衡各类别数据，以提升模型对少数类别的识别能力。

特点

UNSW-NB15数据集的显著特点在于其多样化的攻击类型和实际网络数据包的原始记录，这为网络入侵检测提供了丰富的数据资源。此外，数据集通过数据增强技术处理类别不平衡问题，增强了模型的泛化能力和对少数类别的识别精度。数据集还特别移除了部分与安全相关的特征，以提升模型的安全性和鲁棒性。

使用方法

使用UNSW-NB15数据集时，用户可直接下载预处理后的数据集文件dataset.csv，并通过运行main.py脚本进行模型训练和测试。数据集支持多种数据增强技术，如SMOTE和GAN，用户可根据需求选择合适的方法进行数据处理。此外，数据集提供了详细的评估指标，如准确率、内存使用和运行时间，帮助用户全面评估模型性能。

背景与挑战

背景概述

UNSW-NB15数据集是由澳大利亚新南威尔士大学（UNSW）的研究团队创建的网络入侵检测数据集，旨在为网络安全领域的研究提供一个标准化的测试平台。该数据集包含了九种不同的网络攻击类型，如拒绝服务攻击（DoS）、蠕虫、后门和模糊测试等，涵盖了175,341条训练记录和82,332条测试记录。UNSW-NB15的创建不仅填补了网络入侵检测领域数据集的空白，还为研究人员提供了一个评估和比较不同入侵检测算法性能的基准。通过提供详细的网络流量数据，该数据集促进了网络安全技术的进步，特别是在分类和检测新型网络威胁方面。

当前挑战

UNSW-NB15数据集在构建和应用过程中面临多项挑战。首先，数据集中的攻击类别数据分布不均，某些类别的样本数量远少于其他类别，导致模型在训练时容易产生偏差，影响对少数类别的识别能力。其次，数据集的原始数据为网络流量包，处理和分析这些数据需要高度的专业知识和复杂的预处理步骤，增加了数据处理的难度。此外，由于网络攻击手段的不断演变，数据集需要定期更新以保持其时效性和有效性。最后，数据集的使用过程中，如何有效平衡数据增强技术（如GAN和SMOTE）与模型性能之间的关系，以及如何防止模型过拟合，都是当前研究中亟待解决的问题。

常用场景

经典使用场景

在网络安全领域，UNSW-NB15数据集被广泛用于网络入侵检测的研究。其经典使用场景包括通过分析网络流量数据，识别和分类不同类型的网络攻击，如拒绝服务攻击（DoS）、后门攻击、蠕虫攻击和模糊测试攻击。数据集的丰富性和多样性使其成为开发和评估入侵检测系统（IDS）的理想选择。

实际应用

在实际应用中，UNSW-NB15数据集被用于训练和测试各种网络入侵检测系统。这些系统广泛应用于企业和组织的网络安全防护中，帮助实时监控和识别潜在的网络威胁，从而保护关键信息基础设施免受攻击。

衍生相关工作

基于UNSW-NB15数据集，研究人员开发了多种数据增强技术，如生成对抗网络（GAN）和合成少数类过采样技术（SMOTE），以解决数据不平衡问题。此外，该数据集还促进了基于监督对抗变分自编码器（VAE）的网络入侵检测模型的研究，进一步推动了网络安全技术的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集