NF3-Datasets

Name: NF3-Datasets
Creator: 澳大利亚网络安全中心（ACCS）
Published: 2025-03-06 20:58:09
License: 暂无描述

arXiv2025-03-06 更新2025-03-11 收录

下载链接：

http://arxiv.org/abs/2503.04404v1

下载链接

链接失效反馈

官方服务：

资源简介：

NF3-Datasets是由澳大利亚网络安全中心的Cyber Range Lab开发的网络流量数据集，包含四个当代数据集，反映了当前的网络环境和攻击模式。这些数据集被转换为NetFlow格式，并加入了关键的时间特征，如精确的流开始/结束时间和详细的包间到达时间统计，以增强数据集在时间分析方面的实用性，从而提高网络异常检测的准确性。

NF3-Datasets is a network traffic dataset developed by the Cyber Range Lab of the Australian Cyber Security Centre. It contains four contemporary datasets that reflect the current network environment and attack patterns. These datasets have been converted to NetFlow format, with key temporal features including precise flow start/end times and detailed inter-packet arrival time statistics added to enhance the practicality of the datasets for temporal analysis, thereby improving the accuracy of network anomaly detection.

提供机构：

澳大利亚网络安全中心（ACCS）

创建时间：

2025-03-06

搜集汇总

数据集介绍

构建方式

NF3-Datasets是一个包含详细时间信息的网络流量数据集，旨在提升基于机器学习的网络入侵检测系统（NIDS）的性能。该数据集的构建过程涉及将四个著名的NIDS数据集（UNSW-NB15、BoT-IoT、ToN-IoT和CSE-CIC-IDS2018）转换为NetFlow格式，并添加了关键的时间特征，如精确的流量开始/结束时间和详细的包间到达时间（IAT）统计数据。这一过程包括使用nProbe软件将原始的PCAP文件转换为NetFlow记录，并保留原始的时间戳。随后，通过比较精确的时间戳和5元组标识符（源/目的IP、源/目的端口、协议）对流量进行标签化，以区分正常和恶意流量以及特定的攻击类型。

特点

NF3-Datasets的特点在于其丰富的时序信息，包括每个流记录的精确开始和结束时间（毫秒格式），以及每个流的详细IAT统计数据（最小、最大、平均和标准差）。这些时序特征为网络活动提供了精细的视角，有助于识别细微和复杂的攻击行为。此外，数据集的标准化特征集确保了跨数据集的一致性和可比较性，提高了机器学习模型评估的可靠性和一致性。

使用方法

NF3-Datasets可用于网络入侵检测系统的时间序列分析，帮助研究人员和从业者深入了解网络流量和攻击模式随时间的变化。数据集的时间特征允许进行详细的流量长度分布分析、IAT分布分析、流量随时间的变化分析，以及时间频率表示分析。这些分析方法有助于揭示网络行为的动态特性，并为开发更有效的入侵检测模型提供数据基础。此外，数据集的标准化格式和详细的标签信息使其成为机器学习模型开发和评估的理想工具。

背景与挑战

背景概述

NF3-Datasets数据集的研究背景可追溯至2025年，由Majed Luay等人创建，旨在为基于机器学习的网络入侵检测系统（NIDS）提供具有时间特征的NetFlow数据集。该数据集的创建填补了现有NetFlow数据集缺乏时间特征的空白，为研究人员提供了更全面的时间序列分析视角，有助于理解网络流量的动态变化。通过引入时间特征，如包间到达时间和流长度/持续时间，NF3-Datasets增强了NIDS的检测能力，能够捕捉到静态分析中可能遗漏的攻击行为模式。该数据集的发布为网络安全领域的研究提供了宝贵的资源，促进了网络入侵检测技术的发展。

当前挑战

NF3-Datasets数据集所面临的挑战主要包括两个方面：1) 领域问题的挑战：随着网络攻击的复杂性和隐蔽性不断增加，传统的基于特征的入侵检测方法难以应对新型攻击。NF3-Datasets虽然引入了时间特征，但如何有效利用这些特征来提高NIDS的检测率和降低误报率仍然是一个挑战。2) 构建过程中的挑战：构建包含时间特征的数据集需要考虑数据的完整性和真实性。在实际网络环境中，流量数据可能会受到加密、干扰等因素的影响，如何确保数据集的质量和有效性是一个重要的挑战。此外，随着网络环境的不断变化，攻击模式也在不断演变，如何更新和维护数据集以适应新的攻击场景也是一个持续的挑战。

常用场景

经典使用场景

NF3-Datasets 数据集广泛应用于基于机器学习的网络入侵检测系统（NIDS）中。该数据集包含丰富的网络流量数据，特别强调了时间特征，如数据包到达间隔和流量长度/持续时间。这些时间特征对于 NIDS 至关重要，因为它们可以帮助系统识别异常行为和潜在的攻击模式。NF3-Datasets 的经典使用场景包括对网络流量进行深入的时间分析，以便更好地理解网络行为并提高入侵检测的准确性。

衍生相关工作

NF3-Datasets 数据集的发布激发了众多相关研究工作的开展。研究人员利用该数据集进行时间序列分析，探索网络流量的动态变化，并开发更先进的入侵检测模型。此外，NF3-Datasets 还被用于网络安全教育和培训，帮助学生和专业人士了解网络入侵检测的基本原理和技术。NF3-Datasets 的发布为网络安全领域的研究和应用提供了重要的资源和工具。

数据集最近研究