UNSW-NB15、BoT-IoT、ToN-IoT、CSE-CIC-IDS2018的NetFlow版本

Name: UNSW-NB15、BoT-IoT、ToN-IoT、CSE-CIC-IDS2018的NetFlow版本
Creator: 澳大利亚网络安全中心（ACCS）
Published: 2025-03-09 15:31:18
License: 暂无描述

arXiv2025-03-09 更新2025-03-13 收录

下载链接：

http://arxiv.org/abs/2503.04404v2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是由澳大利亚网络安全中心创建的四个现代网络入侵检测系统（NIDS）数据集的NetFlow版本，包括UNSW-NB15、BoT-IoT、ToN-IoT和CSE-CIC-IDS2018。这些数据集提供了丰富的网络流量数据，反映了当前的网络安全环境和攻击模式。本次研究在原有数据集的基础上增加了时间特征，使得数据集更适合进行基于机器学习的NIDS训练和评估。

This dataset comprises NetFlow-format versions of four modern network intrusion detection system (NIDS) datasets developed by the Australian Cyber Security Centre, namely UNSW-NB15, BoT-IoT, ToN-IoT, and CSE-CIC-IDS2018. These datasets feature comprehensive network traffic data that reflects contemporary cybersecurity environments and prevailing attack patterns. In this study, temporal features were added to the original datasets to improve their suitability for machine learning-based NIDS training and evaluation.

提供机构：

澳大利亚网络安全中心（ACCS）

创建时间：

2025-03-06

搜集汇总

数据集介绍

构建方式

本研究通过将四个广泛引用的网络入侵检测系统(NIDS)基准数据集UNSW-NB15、BoT-IoT、ToN-IoT和CSE-CIC-IDS2018转换为NetFlow格式，并添加了之前NetFlow基准数据集中缺失的时序特征，构建了NF3-Datasets。这些数据集的转换是在Ubuntu 20.04 LTS操作系统上使用nProbe软件完成的，该软件专门设计用于处理和将原始网络流量转换为NetFlow记录。通过对原始数据集的PCAP文件进行转换，并保留原始时间戳，从而确保了时间数据的完整性。此外，通过比较精确的时间戳和5元组标识符（源/目标IP、源/目标端口、协议）对每个流量进行标记，以区分正常和恶意流量以及特定类型的攻击。

使用方法

NF3-Datasets的使用方法主要涉及对网络流量的时序分析。研究人员可以通过对流量长度分布、包间到达时间分布、流量数量随时间的变化、以及NetFlow特征的时序和时频表示等方面进行分析，来深入了解网络行为。此外，这些数据集还可以用于训练和评估基于机器学习的网络入侵检测模型，以提高模型对网络攻击的检测和分类能力。

背景与挑战

背景概述

随着网络攻击的日益复杂化和网络流量的海量增长，传统的网络安全监测方法已难以应对。网络入侵检测系统（NIDS）作为一种重要的网络安全工具，需要高质量的训练数据集来提高其检测能力。Majed Luay等人于2025年提出的论文《Temporal Analysis of NetFlow Datasets for Network Intrusion Detection Systems》中，针对现有NetFlow数据集缺乏时间特征的问题，创建并公开了一个包含时间特征的NetFlow数据集系列，旨在提高基于机器学习的NIDS的检测准确性。该研究填补了现有数据集在时间特征方面的空白，为网络入侵检测领域的研究提供了新的视角和资源。

当前挑战

尽管该研究在NIDS领域取得了重要进展，但仍面临一些挑战。首先，如何优化机器学习模型以有效利用时间特征，提高检测精度，是当前研究的重要课题。其次，时间频率分析方法在实际入侵检测场景中的实用性需要进一步评估。此外，探索其他时间表示方法，如循环神经网络（RNNs）和转换器（transformers），可能为攻击检测提供新的思路。

常用场景

经典使用场景

在网络安全领域，网络入侵检测系统（NIDS）是维护网络基础设施安全与完整性的关键组件。该数据集被广泛应用于机器学习（ML）为基础的NIDS中，通过分析网络流量数据来识别可疑活动、未经授权的访问尝试和潜在的安全漏洞。数据集中包含的时序特征，如数据包到达时间间隔和流长度/持续时间，对于检测网络攻击至关重要。

解决学术问题

该数据集解决了现有NIDS数据集中缺乏时序特征的难题。通过引入时序特征，研究者可以更深入地分析网络流量模式，从而更准确地检测异常行为。此外，该数据集还提供了网络流量随时间变化的全面分析，揭示了不同网络行为类别中各种特征的分布情况，为网络攻击的检测和分类提供了新的视角。

实际应用

该数据集在实际应用中，可以帮助网络管理员更好地理解和分析网络流量模式，从而提高网络安全性。例如，通过对数据包到达时间间隔的分析，可以识别出异常的网络行为，如拒绝服务（DoS）攻击。此外，该数据集还可以用于训练和评估NIDS模型，以提高其检测和分类网络攻击的准确性。

数据集最近研究