five

UNSW-NB15|网络安全数据集|数据集数据集

收藏
kaggle2023-03-19 更新2024-03-11 收录
网络安全
数据集
下载链接:
https://www.kaggle.com/datasets/alextamboli/unsw-nb15
下载链接
链接失效反馈
资源简介:
by the IXIA Perfect Storm tool. Australian Centre for Cyber Security (ACCS)
创建时间:
2023-03-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
UNSW-NB15数据集的构建基于澳大利亚新南威尔士大学(UNSW)的网络流量数据,通过模拟真实世界的网络攻击和正常流量,旨在提供一个全面且多样化的网络流量分析基准。数据集包含了九种不同的攻击类型和正常流量,通过使用KDD测试集的变体和新的攻击类型进行扩展,确保了数据集的广泛性和代表性。
特点
UNSW-NB15数据集以其高度的多样性和复杂性著称,涵盖了多种网络攻击和正常流量模式,为网络安全领域的研究提供了丰富的资源。数据集中的特征包括49个原始网络流量属性,以及通过数据预处理和特征工程生成的19个新特征,这些特征能够有效捕捉网络流量的关键信息,从而支持多种机器学习和数据挖掘算法的应用。
使用方法
UNSW-NB15数据集适用于多种网络安全相关的研究任务,包括但不限于入侵检测、异常检测和网络流量分类。研究者可以通过加载数据集,利用其丰富的特征集进行模型训练和验证。数据集的多样性和复杂性使得其在评估和比较不同入侵检测算法时具有显著优势,同时也为开发新的检测方法提供了坚实的基础。
背景与挑战
背景概述
UNSW-NB15数据集由澳大利亚新南威尔士大学(UNSW)于2015年发布,旨在为网络安全领域的研究提供一个全面且多样化的数据资源。该数据集包含了多种网络攻击和正常网络流量,涵盖了从传统的DoS攻击到复杂的APT攻击等多种类型。发布者希望通过这一数据集,推动网络入侵检测系统(IDS)的研究与开发,提升系统对新型攻击的识别能力。UNSW-NB15的发布,标志着网络安全研究进入了一个新的阶段,为研究人员提供了一个标准化的测试平台,极大地促进了相关技术的进步。
当前挑战
UNSW-NB15数据集在构建过程中面临了多重挑战。首先,数据集需要涵盖广泛的网络攻击类型,以确保其全面性,这要求研究团队具备深厚的网络安全知识和丰富的实战经验。其次,数据集的标注工作极为复杂,需要精确区分正常流量与各种攻击流量,这对标注人员的专业素养提出了高要求。此外,数据集的规模庞大,如何高效地存储、处理和分析这些数据,也是一大技术难题。最后,随着网络攻击手段的不断演变,如何保持数据集的时效性和前瞻性,是UNSW-NB15持续面临的挑战。
发展历史
创建时间与更新
UNSW-NB15数据集由澳大利亚新南威尔士大学于2015年创建,旨在为网络安全领域的研究提供一个全面且多样化的数据资源。该数据集自创建以来,未有官方的更新记录,但其持续被广泛应用于各类网络安全研究中。
重要里程碑
UNSW-NB15数据集的创建标志着网络安全研究进入了一个新的阶段,它不仅包含了传统的网络攻击数据,还引入了现代网络环境中的新型攻击模式,如高级持续性威胁(APT)和零日攻击。这一数据集的发布,极大地推动了基于机器学习和深度学习的网络安全检测技术的发展,成为众多研究论文和实验的标准数据集。此外,UNSW-NB15还促进了跨学科的合作,吸引了来自计算机科学、信息安全、统计学等多个领域的研究者共同探索网络安全的未来。
当前发展情况
当前,UNSW-NB15数据集仍然是网络安全研究领域的重要资源,被广泛应用于各种机器学习模型的训练和测试。随着网络攻击手段的不断演变,该数据集的多样性和复杂性使其在检测新型攻击和评估防御策略方面具有不可替代的作用。同时,UNSW-NB15也激发了更多数据集的创建,推动了网络安全数据科学的整体进步。尽管已有多年历史,UNSW-NB15依然保持着其作为基准数据集的地位,为新一代网络安全技术的研发提供了坚实的基础。
发展历程
  • UNSW-NB15数据集首次发表,由澳大利亚新南威尔士大学(UNSW)的Cyber Range Lab创建,旨在为网络入侵检测系统(NIDS)提供一个全面且多样化的测试平台。
    2015年
  • UNSW-NB15数据集首次应用于学术研究,多个研究团队开始使用该数据集进行网络入侵检测算法的研究和评估。
    2016年
  • UNSW-NB15数据集在多个国际会议和期刊上被广泛引用,成为网络入侵检测领域的重要基准数据集之一。
    2017年
  • UNSW-NB15数据集的扩展版本发布,增加了更多的网络流量数据和攻击类型,进一步丰富了数据集的内容。
    2018年
  • UNSW-NB15数据集被应用于多个工业界的网络安全项目中,验证了其在实际应用中的有效性和可靠性。
    2019年
  • UNSW-NB15数据集的社区贡献版发布,允许研究者和开发者共享和贡献新的数据集变体,促进了数据集的持续发展和改进。
    2020年
常用场景
经典使用场景
在网络安全领域,UNSW-NB15数据集被广泛用于网络入侵检测系统的开发与评估。该数据集包含了多种类型的网络流量数据,涵盖了正常流量和多种攻击流量,如拒绝服务攻击(DoS)、远程到本地攻击(R2L)等。研究者通过分析这些数据,可以设计出更为精准的入侵检测算法,从而提高网络安全性。
实际应用
在实际应用中,UNSW-NB15数据集被用于训练和测试各种入侵检测系统(IDS)。例如,企业网络安全团队利用该数据集来验证其IDS的准确性和鲁棒性,确保系统能够在真实网络环境中有效识别和防御各种网络攻击。此外,该数据集还被用于网络安全培训和教育,帮助学生和从业者更好地理解网络攻击的复杂性。
衍生相关工作
基于UNSW-NB15数据集,研究者们开发了多种先进的入侵检测算法和模型。例如,一些研究团队利用深度学习技术,如卷积神经网络(CNN)和长短期记忆网络(LSTM),来提高入侵检测的准确性。此外,该数据集还激发了关于数据增强和特征选择的研究,以进一步提升入侵检测系统的性能和效率。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Papersnake/people_daily_news

人民日报(1946-2023)数据集是CialloCorpus的一部分。

hugging_face 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录