ASNM Datasets

Name: ASNM Datasets
Creator: 布尔诺理工大学信息学院
Published: 2019-10-23 20:44:31
License: 暂无描述

arXiv2019-10-23 更新2024-06-21 收录

下载链接：

http://www.fit.vutbr.cz/~ihomoliak/asnm/

下载链接

链接失效反馈

官方服务：

资源简介：

ASNM数据集是由布尔诺理工大学信息学院的Ivan Homoliak和Petr Hanacek开发的，包含三个网络流量特征数据集，旨在用于测试对抗性分类器和网络入侵检测器。这些数据集包括ASNM-CDX-2009，从CDX 2009数据集中构建；ASNM-TUN，包含合法网络流量样本和隧道混淆技术应用于恶意网络流量的样本；以及ASNM-NPBO，包含非有效载荷基础混淆技术应用于恶意流量和几个合法流量样本。这些数据集的创建旨在区分合法和恶意TCP连接，适用于被动监控（可能加密的）网络流量，并用于测试任意使用ASNM特征的分类器的逃避抵抗性。

提供机构：

布尔诺理工大学信息学院

创建时间：

2019-10-23

搜集汇总

数据集介绍

构建方式

在网络安全研究领域，构建高质量的数据集对于评估入侵检测系统的性能至关重要。ASNM数据集系列通过从网络流量痕迹中提取高级安全网络度量（ASNM）特征而构建，这些特征专门设计用于区分合法流量与恶意TCP连接。具体而言，该系列包含三个子数据集：ASNM-CDX-2009基于现有的CDX 2009数据集构建，而ASNM-TUN和ASNM-NPBO则是在实验室环境中通过虚拟网络架构收集的。构建过程中，研究人员利用tcpdump痕迹进行特征提取，避免了深度数据包检测，从而适用于加密流量的被动监控。此外，后两个数据集还引入了对抗性混淆技术，包括隧道化混淆和非基于有效载荷的混淆，以模拟真实网络中的攻击规避行为。

特点

ASNM数据集的显著特点在于其专注于非基于有效载荷的网络入侵检测，通过194个ASNM特征全面描述TCP连接的多维属性。这些特征涵盖统计、动态、定位、分布式和行为五大类别，能够捕捉网络流量的复杂行为模式。数据集特别集成了多种对抗性混淆技术，如HTTP(S)隧道化以及通过TCP分段、重传、数据包损坏和重排序等非基于有效载荷的混淆，为测试机器学习分类器的规避抵抗力提供了独特资源。此外，数据集提供了多粒度标签系统，包括二分类、三分类及细粒度的多服务标签，支持从基础检测到高级对抗性分类的广泛研究需求。

使用方法

ASNM数据集主要用于评估和测试基于机器学习的网络入侵检测分类器，特别是在对抗性环境下的性能。研究人员可通过加载数据集中的特征向量和相应标签，利用监督学习算法训练分类模型。数据集支持标准的交叉验证实验，以评估模型在检测直接攻击和混淆攻击时的准确率、召回率等指标。对于对抗性分类研究，可通过比较模型在包含与不包含混淆攻击样本的训练数据上的表现，分析其规避抵抗力。此外，数据集的多标签结构允许进行细粒度的服务特定分析或混淆技术特定分析。使用前需注意预处理步骤，如移除与上下文相关的特征（如IP地址、TTL），以确保在不同网络环境下的泛化能力。

背景与挑战

背景概述

ASNM数据集由布尔诺理工大学信息科技学院的研究团队于2019年正式提出，旨在为网络入侵检测领域的对抗性分类器测试提供标准化评估资源。该数据集基于高级安全网络度量特征构建，涵盖了2009年至2018年间采集的网络流量数据，核心研究聚焦于非负载式网络入侵检测与对抗性机器学习。通过集成隧道混淆与非负载混淆技术，ASNM数据集首次系统性地模拟了针对机器学习分类器的逃避攻击场景，为评估入侵检测系统在对抗环境下的鲁棒性提供了关键实验平台，显著推动了网络安全领域对抗性机器学习研究的发展。

当前挑战

ASNM数据集主要面临两大挑战：其一，在解决网络入侵检测的领域问题时，需应对对抗性混淆技术导致的特征空间偏移，例如隧道封装与流量整形可能使恶意流量在统计特征上与合法流量高度相似，从而挑战分类器的泛化能力；其二，在数据集构建过程中，研究人员需克服真实网络环境模拟的复杂性，包括漏洞服务的历史版本获取限制、对抗性样本的自动化生成，以及多源合法流量的隐私保护与匿名化处理，这些因素共同增加了数据采集与标注的工程难度。

常用场景

经典使用场景

在网络安全研究领域，ASNM数据集为基于机器学习的网络入侵检测系统提供了关键评估基准。该数据集通过提取TCP连接的高级网络特征，构建了包含恶意与良性流量的结构化样本集合。其经典应用场景聚焦于测试分类器在非负载检测模式下的性能表现，研究者利用该数据集训练监督学习模型，以区分正常通信与缓冲区溢出等攻击行为，为入侵检测算法的开发与优化奠定实证基础。

解决学术问题

ASNM数据集有效应对了网络入侵检测研究中对抗性规避的挑战。传统检测方法易受混淆技术影响，导致分类器性能下降。该数据集通过集成隧道混淆与非负载混淆技术，模拟了真实网络环境中攻击者修改流量特征的行为，为研究对抗性分类提供了实验平台。其意义在于推动了鲁棒性检测模型的发展，使学术界能够系统评估分类器在面临规避攻击时的稳定性，进而促进检测技术向动态防御演进。

衍生相关工作

围绕ASNM数据集，学术界衍生出多项经典研究工作。例如，基于特征选择方法优化分类器性能的探索，推动了前向特征选择在网络安全领域的应用。针对对抗性样本的生成与防御研究，进一步深化了对抗机器学习在入侵检测中的理论框架。此外，数据集被广泛用于比较不同分类算法（如朴素贝叶斯、支持向量机与决策树）的鲁棒性，为后续研究提供了基准参照，并促进了网络流量行为建模与异常检测技术的交叉创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集