恶意网络流量数据集

Name: 恶意网络流量数据集
Creator: 光州科学技术院
Published: 2024-10-24 07:58:10
License: 暂无描述

arXiv2024-10-24 更新2024-10-26 收录

下载链接：

https://drive.google.com/drive/folders/11DDvarZg9YOvzPfK2e78CLP7S_a9bCXm

下载链接

链接失效反馈

官方服务：

资源简介：

恶意网络流量数据集是由光州科学技术院的研究团队创建的，旨在通过容器、Kubernetes和eBPF/XDP技术生成满足完全真实性的恶意网络流量。数据集通过模拟多种网络威胁生成，包括DDoS攻击、DoS攻击和暴力破解等，数据量和Tokens数未明确提及。数据集的创建过程利用了先进的网络测试平台，确保了数据的真实性和多样性。该数据集主要应用于机器学习基础的网络入侵检测研究，旨在解决现有数据集难以扩展和无法保证完全真实性的问题。

This malicious network traffic dataset was created by a research team from Gwangju Institute of Science and Technology (GIST). It was developed to generate fully realistic malicious network traffic using containerization, Kubernetes, and eBPF/XDP technologies. The dataset is generated by simulating various network threats, including DDoS attacks, DoS attacks, brute-force attacks and others. The exact data volume and number of tokens are not specified. Its creation process leverages an advanced network testbed to ensure the realism and diversity of the dataset. This dataset is primarily applied to machine learning-based network intrusion detection research, aiming to address the issues that existing datasets are difficult to scale and cannot guarantee full authenticity.

提供机构：

光州科学技术院

创建时间：

2024-10-24

搜集汇总

数据集介绍

构建方式

恶意网络流量数据集的构建基于一个先进的测试平台，该平台利用容器、Kubernetes和eBPF/XDP技术生成网络流量。通过从虚拟机向容器的转变，实现了网络流量的可扩展性、模块化和异质性。每个容器的高度专业化使得数据集能够完全满足真实性要求。此外，使用了Kubernetes进行容器编排，eBPF/XDP用于网络流量捕获，确保了数据集的高效生成和精确性。

特点

该数据集的主要特点在于其完全满足真实性要求，这是通过高度专业化的容器和先进的网络技术实现的。此外，数据集包含了多种网络威胁的模拟流量，涵盖了DoS、DDoS、暴力破解和Heartbleed等多种攻击类型。这些特点使得该数据集成为机器学习网络实验的理想选择，能够支持多样化的网络入侵检测研究。

使用方法

研究人员可以通过访问公开的数据集链接获取恶意网络流量数据，并利用这些数据进行机器学习算法的训练和测试。数据集的组织结构清晰，便于分析和处理。此外，测试平台还配备了GPU加速的机器学习处理机，支持研究人员进行高效的机器学习实验。通过这些资源，研究人员可以深入探索网络入侵检测的最新技术。

背景与挑战

背景概述

恶意网络流量数据集是由Talaya Farasat、JongWon Kim和Joachim Posegga等研究人员在2022年创建的，主要由德国Passau大学和韩国Gwangju科学技术研究院（GIST）合作开发。该数据集的核心研究问题是如何利用先进的容器技术、Kubernetes和eBPF/XDP技术生成具有完美真实性的恶意网络流量数据，以支持基于机器学习的网络入侵检测实验。这一数据集的推出，填补了传统网络入侵数据集在扩展性和真实性方面的不足，为网络安全领域的研究提供了新的实验平台和数据资源。

当前挑战

恶意网络流量数据集在构建过程中面临多项挑战。首先，如何确保生成的恶意流量数据具有完美的真实性，这是一个技术难题，因为传统的测试平台难以满足这一要求。其次，数据集的生成依赖于复杂的容器技术和Kubernetes编排，这增加了系统的复杂性和维护难度。此外，数据集的扩展性和异构性要求测试平台具备高度的灵活性和可扩展性。最后，数据集的公开和共享需要解决数据隐私和安全问题，确保研究者能够安全地访问和使用这些敏感数据。

常用场景

经典使用场景

恶意网络流量数据集在网络安全领域中被广泛用于机器学习驱动的入侵检测系统（IDS）的训练和评估。通过模拟多种网络威胁，如分布式拒绝服务攻击（DDoS）、慢速攻击和暴力破解攻击，该数据集为研究人员提供了一个真实且多样化的网络流量环境。这种数据集的典型使用场景包括开发和测试新的入侵检测算法，评估现有IDS的性能，以及验证防御策略的有效性。

衍生相关工作

恶意网络流量数据集的发布催生了一系列相关的经典工作。例如，基于该数据集的研究论文探讨了如何利用机器学习技术提升入侵检测的准确性和效率。此外，还有研究专注于优化eBPF/XDP技术在网络流量捕获和分析中的应用，进一步提升了数据集的实用性和研究价值。这些衍生工作不仅丰富了网络安全领域的研究内容，还为实际应用提供了有力的技术支持。

数据集最近研究