five

Mireu-Lab/UNSW-NB15|网络安全数据集|网络攻击检测数据集

收藏
hugging_face2024-07-18 更新2024-03-04 收录
网络安全
网络攻击检测
下载链接:
https://hf-mirror.com/datasets/Mireu-Lab/UNSW-NB15
下载链接
链接失效反馈
资源简介:
UNSW-NB15数据集是一个网络流量数据集,提供了82332条记录,每条记录包含45个特征,涵盖了网络流量的多个方面,如持续时间、协议类型、服务类型、状态等。数据集还包含攻击类别和标签列,用于标识是否为攻击流量。该数据集主要用于网络安全领域的研究和分析。

The UNSW-NB15 dataset is a network traffic dataset that provides 82,332 records, each containing 45 features covering various aspects of network traffic, such as duration, protocol type, service type, state, etc. The dataset also includes attack categories and a label column to identify whether the traffic is an attack. This dataset is primarily used for research and analysis in the field of network security.
提供机构:
Mireu-Lab
原始信息汇总

数据集概述

数据集名称

  • UNSW-NB15

数据集标签

  • Network Security

数据集许可证

  • GPL-3.0

数据集结构

  • 文件类型: CSV
  • 数据记录数: 82332条
  • 数据字段: 共45个字段,包括但不限于:
    • id, dur, proto, service, state 等,涵盖了网络流量统计、协议类型、服务类型、状态等多个方面。
    • 数据类型包括 int64, float64, object。

数据集用途

  • 用于网络安全的研究和分析。
AI搜集汇总
数据集介绍
main_image_url
构建方式
UNSW-NB15数据集的构建基于网络流量分析,通过收集和分析网络流量数据,提取出包括协议类型、服务状态、数据包大小、传输速率等在内的多种特征。数据集的构建过程严格遵循科学方法,确保数据的完整性和准确性,最终形成了一个包含82332条记录的网络流量数据集,每条记录均包含45个特征字段,涵盖了网络流量的各个方面。
特点
UNSW-NB15数据集的显著特点在于其全面性和多样性。数据集不仅包含了网络流量的基本特征,如协议类型、服务状态等,还涵盖了高级特征,如传输层协议的详细信息、数据包的传输延迟等。此外,数据集中的每条记录均标记了攻击类别和标签,为网络安全领域的研究提供了丰富的数据支持。
使用方法
UNSW-NB15数据集适用于多种网络安全研究场景,包括但不限于网络入侵检测、恶意流量识别和网络行为分析。使用该数据集时,研究者可以通过加载CSV文件,利用Python等编程语言进行数据预处理和特征提取。随后,可以采用机器学习或深度学习模型对数据进行训练和测试,以实现对网络流量的精准分类和异常检测。
背景与挑战
背景概述
在网络安全的研究领域中,UNSW-NB15数据集的创建标志着对复杂网络攻击检测技术的一次重要探索。该数据集由澳大利亚新南威尔士大学(UNSW)的研究团队于近年开发,旨在提供一个全面且多样化的网络流量数据集,以支持网络入侵检测系统的研究与开发。UNSW-NB15数据集的核心研究问题是如何有效区分正常网络流量与恶意攻击流量,这对于提升网络安全防护能力具有重要意义。该数据集的发布不仅丰富了网络安全领域的研究资源,还为相关算法和模型的评估提供了标准化的基准。
当前挑战
UNSW-NB15数据集在构建过程中面临了多重挑战。首先,数据集的多样性和复杂性要求研究人员必须处理大量的网络流量特征,这包括但不限于协议类型、服务状态、数据包大小和传输速率等。其次,确保数据集的准确性和代表性也是一个重大挑战,因为网络攻击的种类繁多且不断演变,如何捕捉到最新的攻击模式并将其纳入数据集是一个持续的难题。此外,数据集的规模和质量也对其在实际应用中的有效性提出了挑战,研究人员需要在保证数据集规模的同时,确保每个样本的特征清晰且无误。
常用场景
经典使用场景
在网络安全领域,UNSW-NB15数据集被广泛用于网络流量分类和入侵检测系统的开发与评估。通过分析数据集中的网络流量特征,如协议类型、服务状态、数据包大小等,研究者能够构建高效的机器学习模型,以识别和分类不同类型的网络攻击。这种基于特征的分类方法不仅提高了检测的准确性,还为实时监控和防御提供了有力支持。
解决学术问题
UNSW-NB15数据集解决了网络安全领域中网络流量分类和入侵检测的关键问题。传统的入侵检测系统往往依赖于规则和签名,难以应对新型和复杂的攻击。该数据集通过提供丰富的网络流量特征和详细的攻击类别标签,使得研究者能够开发出更为智能和自适应的检测模型,从而显著提升了入侵检测的效率和准确性。
衍生相关工作
基于UNSW-NB15数据集,研究者们开发了多种先进的入侵检测算法和模型。例如,一些研究工作利用深度学习技术,如卷积神经网络(CNN)和长短期记忆网络(LSTM),来提高检测的准确性和效率。此外,还有研究探讨了如何结合其他数据源,如日志数据和用户行为数据,以构建更为全面的网络安全防护体系。这些衍生工作不仅丰富了网络安全领域的研究内容,也为实际应用提供了更多可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LEGO数据集

该数据集包含了关于LEGO公司的历史、产品提供以及特定LEGO套装的信息,用于分析LEGO套装的规模、发布年份、主题分布以及套装复杂性的变化。

github 收录

Global Solar Dataset

在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。

github 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

ECMWF Reanalysis v5 (ERA5)

ERA5 是第五代 ECMWF 全球气候大气再分析,涵盖从 1940 年 1 月至今的时期。ERA5 由 ECMWF 的哥白尼气候变化服务 (C3S) 制作。 ERA5 提供大量大气、陆地和海洋气候变量的每小时估计值。这些数据以 30 公里的网格覆盖地球,并使用从地表到 80 公里高度的 137 个级别解析大气。ERA5 包括有关所有变量在降低空间和时间分辨率下的不确定性的信息。

OpenDataLab 收录