codymlewis/nbaiot
收藏Hugging Face2023-10-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/codymlewis/nbaiot
下载链接
链接失效反馈官方服务:
资源简介:
N-BAIoT数据集旨在解决公共僵尸网络数据集的缺乏问题,特别是针对物联网(IoT)设备。该数据集提供了真实的流量数据,这些数据是从9种商业IoT设备中收集的,这些设备被Mirai和BASHLITE两种僵尸网络真实感染。数据集的特征包括115个浮点数的序列、10种攻击类型和1种良性流量,以及9种不同的IoT设备类型。数据集分为训练集和测试集,训练集包含6002588个样本,测试集包含1060018个样本。该数据集可以用于异常检测和多类分类任务。
The N-BAIoT dataset is designed to address the shortage of public botnet datasets, particularly for Internet of Things (IoT) devices. It provides real-world traffic data collected from nine commercial IoT devices that were genuinely infected by two botnets, Mirai and BASHLITE. The dataset includes 115-dimensional floating-point sequences, 10 types of attack traffic, 1 type of benign traffic, and 9 distinct IoT device categories. It is split into training and test sets, with the training set containing 6,002,588 samples and the test set containing 1,060,018 samples. This dataset can be used for anomaly detection and multi-class classification tasks.
提供机构:
codymlewis
原始信息汇总
数据集卡片 for N-BAIoT
数据集详情
数据集描述
-
特征描述:
features: 序列类型,长度为115,数据类型为float32。attack: 类别标签,包含11个类别,分别是:- 0: benign_traffic
- 1: combo
- 2: junk
- 3: mirai-ack
- 4: mirai-scan
- 5: mirai-syn
- 6: mirai-udp
- 7: mirai-udpplain
- 8: scan
- 9: tcp
- 10: udp
device: 类别标签,包含9个类别,分别是:- 0: Danmini_Doorbell
- 1: Ecobee_Thermostat
- 2: Ennio_Doorbell
- 3: Philips_B120N10_Baby_Monitor
- 4: Provision_PT_737E_Security_Camera
- 5: Provision_PT_838_Security_Camera
- 6: Samsung_SNH_1011_N_Webcam
- 7: SimpleHome_XCS7_1002_WHT_Security_Camera
- 8: SimpleHome_XCS7_1003_WHT_Security_Camera
-
数据集划分:
train: 包含6002588个样本,总字节数为2857231888。test: 包含1060018个样本,总字节数为504568568。
-
数据集大小:
- 下载大小:1772922927字节。
- 数据集总大小:3361800456字节。
-
许可证: Creative Commons Attribution 4.0 International (CC BY 4.0)
数据集来源
- 数据集名称: N-BAIoT
- 数据集目的: 用于检测IoT僵尸网络攻击。
- 数据集特点: 包含9种商业IoT设备的真实流量数据,这些设备被Mirai和BASHLITE僵尸网络真实感染。
数据集使用
- 原始目标: 通过异常检测技术区分良性流量和恶意流量数据。
- 扩展用途: 由于恶意数据可以分为10种攻击类型,数据集也可用于多类别分类,包括10种攻击类型和1种良性流量。
数据集结果
- 训练过程: 对每种IoT设备,使用其2/3的良性数据(即每个设备的训练集)训练和优化深度自动编码器,以捕捉正常网络流量模式。
- 测试过程: 每个设备的测试数据包括剩余的1/3良性数据和所有恶意数据。在每个测试集上应用相应的训练好的深度自动编码器作为异常检测器。异常检测(即从每个IoT设备发起的网络攻击)的结论是100%的真正例率(TPR)。
数据集创建者
- 创建者: Meidan, Yair, Bohadana, Michael, Mathov, Yael, Mirsky, Yisroel, Breitenbacher, Dominik, Asaf, and Shabtai, Asaf
搜集汇总
数据集介绍

构建方式
该数据集的构建基于对9种商用物联网设备的实际流量数据进行采集,这些设备均被Mirai和BASHLITE恶意软件感染。研究团队通过深度自动编码器对每种设备的良性数据进行训练,以捕捉正常的网络流量模式。测试数据则由剩余的良性数据和所有恶意数据组成,通过应用训练好的自动编码器进行异常检测,从而实现了对网络攻击的100%真阳性率检测。
特点
该数据集的显著特点在于其真实性和多样性。它不仅包含了多种物联网设备的流量数据,还涵盖了10种不同的攻击类型,包括Mirai和BASHLITE的多种变种攻击。此外,数据集还区分了良性流量和恶意流量,适用于多类分类任务,为研究物联网安全提供了丰富的资源。
使用方法
使用该数据集时,研究者可以利用其进行物联网设备的安全性评估和攻击检测模型的训练。通过分析'features'字段中的流量特征,结合'attack'和'device'字段,可以实现对不同设备和攻击类型的分类。数据集提供了训练和测试两个子集,分别包含6002588和1060018个样本,适合用于开发和验证机器学习模型。
背景与挑战
背景概述
随着物联网(IoT)技术的迅猛发展,IoT设备的安全问题日益凸显。codymlewis/nbaiot数据集由Meidan, Yair等人于2018年创建,旨在填补公共IoT botnet数据集的空白。该数据集收集了9种商业IoT设备的真实流量数据,这些设备被Mirai和BASHLITE恶意软件感染。通过深度自动编码器技术,研究人员成功捕捉了正常网络流量模式,并在测试数据上实现了100%的真阳性率(TPR)。这一研究不仅为IoT安全领域的异常检测提供了宝贵的数据资源,还推动了多类分类技术在该领域的应用。
当前挑战
codymlewis/nbaiot数据集在构建过程中面临多重挑战。首先,收集真实感染的IoT设备流量数据涉及高度的隐私和安全风险。其次,数据集需要精确区分10种不同的攻击类型和正常流量,这对异常检测技术提出了高要求。此外,由于IoT设备的多样性和复杂性,确保数据集在不同设备上的通用性和有效性也是一个重要挑战。这些挑战不仅影响了数据集的构建过程,也对其在实际应用中的效果提出了考验。
常用场景
经典使用场景
在物联网(IoT)安全领域,codymlewis/nbaiot数据集被广泛用于检测和分类IoT设备中的恶意流量。该数据集通过收集来自9种不同商业IoT设备的实际流量数据,包括被Mirai和BASHLITE恶意软件感染的设备,提供了丰富的多类分类场景。研究者可以利用这些数据训练深度自动编码器,以识别正常和异常的网络流量模式,从而实现对IoT设备的安全监控和攻击检测。
实际应用
在实际应用中,codymlewis/nbaiot数据集被用于开发和验证IoT设备的安全监控系统。通过分析和识别不同类型的恶意流量,这些系统能够及时发现并阻止潜在的网络攻击,保护IoT设备及其连接的网络免受恶意软件的侵害。此外,该数据集还支持企业级安全解决方案的研发,提升整体网络安全水平。
衍生相关工作
基于codymlewis/nbaiot数据集,研究者们开发了多种先进的IoT安全检测模型和算法。例如,一些研究工作利用深度学习技术,如卷积神经网络(CNN)和循环神经网络(RNN),来提升恶意流量检测的准确性和效率。此外,该数据集还激发了对IoT设备行为模式分析的研究,推动了基于行为分析的入侵检测系统(IDS)的发展。
以上内容由遇见数据集搜集并总结生成



