恶意网络流量数据集
收藏arXiv2024-10-24 更新2024-10-26 收录
下载链接:
https://drive.google.com/drive/folders/11DDvarZg9YOvzPfK2e78CLP7S_a9bCXm
下载链接
链接失效反馈资源简介:
恶意网络流量数据集是由光州科学技术院的研究团队创建的,旨在通过容器、Kubernetes和eBPF/XDP技术生成满足完全真实性的恶意网络流量。数据集通过模拟多种网络威胁生成,包括DDoS攻击、DoS攻击和暴力破解等,数据量和Tokens数未明确提及。数据集的创建过程利用了先进的网络测试平台,确保了数据的真实性和多样性。该数据集主要应用于机器学习基础的网络入侵检测研究,旨在解决现有数据集难以扩展和无法保证完全真实性的问题。
This malicious network traffic dataset was developed by a research team from the Gwangju Institute of Science and Technology (GIST). The project aims to generate fully realistic malicious network traffic utilizing container, Kubernetes, and eBPF/XDP technologies. The dataset is created by simulating a variety of network threats, including DDoS attacks, DoS attacks, brute-force attacks, among others. The exact volume of the dataset and the number of tokens are not specified. The dataset creation process employs an advanced network testing platform, which ensures the authenticity and diversity of the collected data. This dataset is mainly used for machine learning-based network intrusion detection research, with the goal of resolving the limitations of existing datasets, namely their difficulty in scaling and the inability to guarantee full authenticity.
提供机构:
光州科学技术院
创建时间:
2024-10-24
搜集汇总
数据集介绍

构建方式
恶意网络流量数据集的构建基于一个先进的测试平台,该平台利用容器、Kubernetes和eBPF/XDP技术生成网络流量。通过从虚拟机向容器的转变,实现了网络流量的可扩展性、模块化和异质性。每个容器的高度专业化使得数据集能够完全满足真实性要求。此外,使用了Kubernetes进行容器编排,eBPF/XDP用于网络流量捕获,确保了数据集的高效生成和精确性。
特点
该数据集的主要特点在于其完全满足真实性要求,这是通过高度专业化的容器和先进的网络技术实现的。此外,数据集包含了多种网络威胁的模拟流量,涵盖了DoS、DDoS、暴力破解和Heartbleed等多种攻击类型。这些特点使得该数据集成为机器学习网络实验的理想选择,能够支持多样化的网络入侵检测研究。
使用方法
研究人员可以通过访问公开的数据集链接获取恶意网络流量数据,并利用这些数据进行机器学习算法的训练和测试。数据集的组织结构清晰,便于分析和处理。此外,测试平台还配备了GPU加速的机器学习处理机,支持研究人员进行高效的机器学习实验。通过这些资源,研究人员可以深入探索网络入侵检测的最新技术。
背景与挑战
背景概述
恶意网络流量数据集是由Talaya Farasat、JongWon Kim和Joachim Posegga等研究人员在2022年创建的,主要由德国Passau大学和韩国Gwangju科学技术研究院(GIST)合作开发。该数据集的核心研究问题是如何利用先进的容器技术、Kubernetes和eBPF/XDP技术生成具有完美真实性的恶意网络流量数据,以支持基于机器学习的网络入侵检测实验。这一数据集的推出,填补了传统网络入侵数据集在扩展性和真实性方面的不足,为网络安全领域的研究提供了新的实验平台和数据资源。
当前挑战
恶意网络流量数据集在构建过程中面临多项挑战。首先,如何确保生成的恶意流量数据具有完美的真实性,这是一个技术难题,因为传统的测试平台难以满足这一要求。其次,数据集的生成依赖于复杂的容器技术和Kubernetes编排,这增加了系统的复杂性和维护难度。此外,数据集的扩展性和异构性要求测试平台具备高度的灵活性和可扩展性。最后,数据集的公开和共享需要解决数据隐私和安全问题,确保研究者能够安全地访问和使用这些敏感数据。
常用场景
经典使用场景
恶意网络流量数据集在网络安全领域中被广泛用于机器学习驱动的入侵检测系统(IDS)的训练和评估。通过模拟多种网络威胁,如分布式拒绝服务攻击(DDoS)、慢速攻击和暴力破解攻击,该数据集为研究人员提供了一个真实且多样化的网络流量环境。这种数据集的典型使用场景包括开发和测试新的入侵检测算法,评估现有IDS的性能,以及验证防御策略的有效性。
衍生相关工作
恶意网络流量数据集的发布催生了一系列相关的经典工作。例如,基于该数据集的研究论文探讨了如何利用机器学习技术提升入侵检测的准确性和效率。此外,还有研究专注于优化eBPF/XDP技术在网络流量捕获和分析中的应用,进一步提升了数据集的实用性和研究价值。这些衍生工作不仅丰富了网络安全领域的研究内容,还为实际应用提供了有力的技术支持。
数据集最近研究
最新研究方向
在网络安全的领域中,恶意网络流量数据集的最新研究方向主要集中在利用先进的容器技术、Kubernetes和eBPF/XDP技术构建动态和可扩展的测试平台。这种测试平台不仅能够生成高质量的恶意网络流量数据集,还能确保数据的‘真实性’,这是传统静态数据集难以实现的。通过这种创新的方法,研究者们能够更有效地模拟和分析网络威胁,从而推动基于机器学习的入侵检测系统的进一步发展。此外,这种测试平台还支持大规模的分布式实验,为网络安全领域的研究提供了新的可能性。
相关研究论文
- 1Advancing Network Security: A Comprehensive Testbed and Dataset for Machine Learning-Based Intrusion Detection光州科学技术院 · 2024年
以上内容由遇见数据集搜集并总结生成



