Composed Encrypted Malicious Traffic Dataset

Name: Composed Encrypted Malicious Traffic Dataset
Creator: ST Engineering Singapore
Published: 2022-03-17 22:00:55
License: 暂无描述

arXiv2022-03-17 更新2024-06-21 收录

下载链接：

https://data.mendeley.com/datasets/ztyk4h3v6s/1

下载链接

链接失效反馈

官方服务：

资源简介：

Composed Encrypted Malicious Traffic Dataset是由ST Engineering Singapore的研究人员创建的一个综合数据集，用于机器学习在加密恶意流量检测领域的研究。该数据集整合了来自多个公开来源的流量数据，旨在提供一个全面且公正的数据集，以支持未来在该领域的研究。数据集包含了多种加密和非加密的恶意流量，以及合法流量，适用于训练和测试加密恶意流量检测算法。创建过程涉及数据收集、预处理和特征提取，确保数据的质量和适用性。该数据集的应用领域主要集中在网络安全，特别是加密流量的恶意行为检测，旨在提高网络的安全性和防御能力。

Composed Encrypted Malicious Traffic Dataset is a comprehensive dataset created by researchers from ST Engineering Singapore for research on machine learning applications in encrypted malicious traffic detection. This dataset aggregates traffic data from multiple public sources, aiming to provide a comprehensive and impartial dataset to support future research in this field. It encompasses diverse encrypted and non-encrypted malicious traffic alongside legitimate traffic, and is applicable for training and testing encrypted malicious traffic detection algorithms. The development of this dataset involves data collection, preprocessing and feature extraction to ensure the quality and applicability of the data. Its main application fields focus on cybersecurity, especially malicious behavior detection in encrypted traffic, with the goal of enhancing network security and defensive capabilities.

提供机构：

ST Engineering Singapore

创建时间：

2022-03-17

搜集汇总

数据集介绍

构建方式

Composed Encrypted Malicious Traffic Dataset 的构建基于对多个公开数据集的分析与整合。研究团队从5个不同的数据源中筛选出适用于加密恶意流量检测的数据集，并对这些数据集进行了预处理和特征提取，最终生成了一个综合性的数据集。该数据集不仅包含了加密的恶意流量，还涵盖了合法流量，确保了数据的多样性和平衡性，为后续的机器学习模型训练提供了坚实的基础。

特点

该数据集的主要特点在于其广泛性和多样性。它包含了来自不同设备和网络环境的加密流量，涵盖了多种加密协议和恶意攻击类型。此外，数据集的构建过程中特别注重了数据的平衡性，确保恶意流量和合法流量的比例合理，避免了数据不均衡对模型性能的影响。

使用方法

该数据集适用于多种机器学习模型的训练和评估，尤其是在加密恶意流量检测领域。用户可以通过提取协议无关的数值特征或特定协议的特征，结合不同的机器学习算法（如随机森林、XGBoost、卷积神经网络等）进行模型训练。数据集的多样性和平衡性使得模型能够在不同场景下进行公平的性能比较，并为未来的研究提供了可靠的基准。

背景与挑战

背景概述

随着人们对隐私和数据安全需求的日益增长，加密流量已成为网络世界的主流。然而，加密技术不仅保护了合法用户的隐私，也为恶意流量提供了掩护，尤其是在后疫情时代，恶意加密流量的增长尤为显著。传统的安全解决方案，如深度包检测（DPI），由于无法解密流量内容而失效。因此，基于机器学习的加密恶意流量检测技术成为研究的重要方向。Composed Encrypted Malicious Traffic Dataset由新加坡ST Engineering的Zihao Wang、Kar-Wai Fok和Vrizlynn L. L. Thing等人创建，旨在解决现有研究中缺乏公认数据集和特征集的问题。该数据集整合了来自5个不同来源的公开流量数据，为未来的研究提供了全面且公平的基准。

当前挑战

加密恶意流量检测面临的主要挑战包括：1）加密技术的广泛应用使得传统基于明文内容的安全解决方案失效；2）恶意流量通过加密手段逃避检测，增加了检测的复杂性；3）现有研究缺乏统一的数据集和特征集，导致模型性能难以进行可靠的比较。此外，数据集构建过程中也面临诸多挑战，如数据的真实性、多样性、平衡性以及标签的准确性。这些挑战使得加密恶意流量检测成为一个复杂且亟待解决的问题。

常用场景

经典使用场景

Composed Encrypted Malicious Traffic Dataset 最经典的使用场景是用于加密恶意流量检测的研究。该数据集通过整合来自多个公开数据源的流量数据，提供了一个全面且平衡的加密恶意流量检测基准。研究者可以利用该数据集训练和评估基于机器学习和深度学习的加密恶意流量检测模型，特别是在无法解密流量内容的情况下，通过流量特征进行恶意行为的识别。

实际应用

在实际应用中，Composed Encrypted Malicious Traffic Dataset 可以用于网络安全设备的开发和测试，特别是在企业网络和物联网设备中。通过训练基于该数据集的检测模型，企业可以更好地识别和防御加密恶意流量，保护网络免受恶意软件、勒索软件等威胁的侵害。此外，该数据集还可用于网络安全培训和教育，帮助安全从业者更好地理解加密恶意流量的特征和检测方法。

衍生相关工作

基于 Composed Encrypted Malicious Traffic Dataset，许多相关工作得以展开。例如，研究者们提出了多种基于机器学习和深度学习的加密恶意流量检测算法，并通过该数据集进行了性能评估。此外，该数据集还促进了特征工程和特征选择的研究，推动了协议无关特征和协议特定特征在加密流量检测中的应用。未来，该数据集有望进一步推动多分类、多任务学习等更复杂检测模型的研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集