five

UNSW-NB15、BoT-IoT、ToN-IoT、CSE-CIC-IDS2018的NetFlow版本|网络安全数据集|网络入侵检测数据集

收藏
arXiv2025-03-09 更新2025-03-13 收录
网络安全
网络入侵检测
下载链接:
http://arxiv.org/abs/2503.04404v2
下载链接
链接失效反馈
资源简介:
该数据集是由澳大利亚网络安全中心创建的四个现代网络入侵检测系统(NIDS)数据集的NetFlow版本,包括UNSW-NB15、BoT-IoT、ToN-IoT和CSE-CIC-IDS2018。这些数据集提供了丰富的网络流量数据,反映了当前的网络安全环境和攻击模式。本次研究在原有数据集的基础上增加了时间特征,使得数据集更适合进行基于机器学习的NIDS训练和评估。
提供机构:
澳大利亚网络安全中心(ACCS)
创建时间:
2025-03-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
本研究通过将四个广泛引用的网络入侵检测系统(NIDS)基准数据集UNSW-NB15、BoT-IoT、ToN-IoT和CSE-CIC-IDS2018转换为NetFlow格式,并添加了之前NetFlow基准数据集中缺失的时序特征,构建了NF3-Datasets。这些数据集的转换是在Ubuntu 20.04 LTS操作系统上使用nProbe软件完成的,该软件专门设计用于处理和将原始网络流量转换为NetFlow记录。通过对原始数据集的PCAP文件进行转换,并保留原始时间戳,从而确保了时间数据的完整性。此外,通过比较精确的时间戳和5元组标识符(源/目标IP、源/目标端口、协议)对每个流量进行标记,以区分正常和恶意流量以及特定类型的攻击。
使用方法
NF3-Datasets的使用方法主要涉及对网络流量的时序分析。研究人员可以通过对流量长度分布、包间到达时间分布、流量数量随时间的变化、以及NetFlow特征的时序和时频表示等方面进行分析,来深入了解网络行为。此外,这些数据集还可以用于训练和评估基于机器学习的网络入侵检测模型,以提高模型对网络攻击的检测和分类能力。
背景与挑战
背景概述
随着网络攻击的日益复杂化和网络流量的海量增长,传统的网络安全监测方法已难以应对。网络入侵检测系统(NIDS)作为一种重要的网络安全工具,需要高质量的训练数据集来提高其检测能力。Majed Luay等人于2025年提出的论文《Temporal Analysis of NetFlow Datasets for Network Intrusion Detection Systems》中,针对现有NetFlow数据集缺乏时间特征的问题,创建并公开了一个包含时间特征的NetFlow数据集系列,旨在提高基于机器学习的NIDS的检测准确性。该研究填补了现有数据集在时间特征方面的空白,为网络入侵检测领域的研究提供了新的视角和资源。
当前挑战
尽管该研究在NIDS领域取得了重要进展,但仍面临一些挑战。首先,如何优化机器学习模型以有效利用时间特征,提高检测精度,是当前研究的重要课题。其次,时间频率分析方法在实际入侵检测场景中的实用性需要进一步评估。此外,探索其他时间表示方法,如循环神经网络(RNNs)和转换器(transformers),可能为攻击检测提供新的思路。
常用场景
经典使用场景
在网络安全领域,网络入侵检测系统(NIDS)是维护网络基础设施安全与完整性的关键组件。该数据集被广泛应用于机器学习(ML)为基础的NIDS中,通过分析网络流量数据来识别可疑活动、未经授权的访问尝试和潜在的安全漏洞。数据集中包含的时序特征,如数据包到达时间间隔和流长度/持续时间,对于检测网络攻击至关重要。
解决学术问题
该数据集解决了现有NIDS数据集中缺乏时序特征的难题。通过引入时序特征,研究者可以更深入地分析网络流量模式,从而更准确地检测异常行为。此外,该数据集还提供了网络流量随时间变化的全面分析,揭示了不同网络行为类别中各种特征的分布情况,为网络攻击的检测和分类提供了新的视角。
实际应用
该数据集在实际应用中,可以帮助网络管理员更好地理解和分析网络流量模式,从而提高网络安全性。例如,通过对数据包到达时间间隔的分析,可以识别出异常的网络行为,如拒绝服务(DoS)攻击。此外,该数据集还可以用于训练和评估NIDS模型,以提高其检测和分类网络攻击的准确性。
数据集最近研究
最新研究方向
本研究的最新研究方向集中在网络入侵检测系统中NetFlow数据集的时序分析。通过对现有NetFlow数据集的时序特征进行分析,本研究填补了当前数据集在时间特征方面的空白。研究结果表明,网络攻击具有独特的时序模式,这有助于机器学习模型更容易地识别它们。此外,本研究还探索了时频分析方法在网络入侵检测中的应用,为未来的研究提供了有价值的方向。
相关研究论文
  • 1
    Temporal Analysis of NetFlow Datasets for Network Intrusion Detection Systems澳大利亚网络安全中心(ACCS) · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

2017-2020年内蒙古当地杂豆的原料特性及生物活性物质分析数据集

参照国标对内蒙古当地的豌豆、赤小豆、绿豆、红芸豆及扁豆等五种杂豆的原料特性和生物活性物质含量进行测定,并进行对比分析。

国家农业科学数据中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

riotu-lab/Synthetic-UAV-Flight-Trajectories

该数据集包含超过5000条随机无人机(UAV)轨迹,这些轨迹是在20小时的飞行时间内收集的,主要用于训练AI模型,如轨迹预测应用。数据集通过自动化管道生成和预处理无人机合成轨迹,使其可以直接用于AI模型训练。数据集的特点是参数化的轨迹,遵循预定义的模式,特别是圆形和无限路径。数据集的结构包括数据字段,如时间戳和无人机的3D位置(x, y, z坐标)。

hugging_face 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录