five

MQTT-IoT-IDS2020

收藏
arXiv2020-11-16 更新2024-06-21 收录
下载链接:
https://ieee-dataport.org/open-access/mqtt-internet-things-intrusiondetection-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MQTT-IoT-IDS2020数据集是由阿伯泰大学网络安全系、捷克技术大学和斯特拉斯克莱德大学联合创建的,旨在为物联网环境中的MQTT协议提供安全分析。该数据集包含53396条记录,涵盖正常操作和四种攻击场景,使用tcpdump工具收集。数据集不仅模拟了真实的MQTT物联网网络,还包含了通用网络扫描攻击和MQTT暴力攻击。研究人员可以利用此数据集构建和评估物联网入侵检测系统,特别是针对MQTT协议的攻击检测。

The MQTT-IoT-IDS2020 dataset was jointly developed by the Department of Cyber Security at Abertay University, Czech Technical University, and the University of Strathclyde, aiming to provide security analysis for the MQTT protocol in IoT environments. This dataset contains 53,396 records covering both normal operation and four attack scenarios, and was collected using the tcpdump tool. It not only simulates a real-world MQTT-based IoT network, but also includes generic network scanning attacks and MQTT brute-force attacks. Researchers can leverage this dataset to construct and evaluate IoT intrusion detection systems, especially for attack detection targeting the MQTT protocol.
提供机构:
阿伯泰大学网络安全系, 邓迪, 苏格兰, 英国; 计算机科学系, 电气工程学院, 捷克技术大学, 布拉格, 捷克; 电子与电气工程系, 斯特拉斯克莱德大学, 格拉斯哥, 苏格兰, 英国
创建时间:
2020-06-27
搜集汇总
数据集介绍
main_image_url
构建方式
MQTT-IoT-IDS2020数据集通过模拟MQTT物联网网络环境构建,涵盖了正常操作和四种攻击场景。数据采集使用tcpdump工具记录以太网流量,并导出为pcap文件。虚拟机模拟网络设备,Nmap用于扫描攻击,VLC模拟摄像头流,MQTT-PWN用于MQTT暴力攻击。网络架构包括12个MQTT传感器、一个代理、一个模拟摄像头流的服务器和一个攻击者。正常操作下,传感器发送随机消息,摄像头流使用UDP传输,网络模拟器以不同丢包率模拟真实场景。攻击场景包括积极扫描、UDP扫描、Sparta SSH暴力攻击和MQTT暴力攻击。
特点
该数据集具有多层次特征,包括包级、单向流和双向流特征。每种特征集独立使用,涵盖了源和目标IP地址、协议、时间戳、包长度、TCP和MQTT标志等。双向流特征进一步区分前向和后向流。数据集的独特之处在于其包含了MQTT特定攻击和通用网络攻击,为研究物联网入侵检测系统提供了丰富的实验数据。此外,数据集的公开发布有助于研究社区进一步分析和应对物联网安全挑战。
使用方法
MQTT-IoT-IDS2020数据集适用于构建和评估物联网入侵检测系统。研究者可以使用该数据集训练和测试多种机器学习技术,如逻辑回归、高斯朴素贝叶斯、k近邻、支持向量机、决策树和随机森林。数据集提供了原始pcap文件和处理后的特征文件,便于直接应用于实验。使用时,建议采用五折交叉验证方法评估模型性能,重点关注整体准确率、精确率、召回率和F1分数。通过分析不同特征层次对检测性能的影响,研究者可以深入理解MQTT网络中攻击与正常流量的区别,从而优化入侵检测模型。
背景与挑战
背景概述
随着物联网(IoT)技术的迅猛发展,其在网络安全领域的研究日益受到重视。MQTT-IoT-IDS2020数据集由Abertay大学、捷克技术大学和斯特拉斯克莱德大学的研究团队共同创建,旨在解决现有入侵检测系统(IDS)在特殊用途网络中的不足。该数据集专注于MQTT协议,这是物联网设备间通信的重要协议之一。通过模拟真实网络环境,数据集包含了正常操作和多种攻击场景,为研究社区提供了宝贵的资源,以评估和开发适用于MQTT网络的机器学习(ML)入侵检测模型。
当前挑战
MQTT-IoT-IDS2020数据集面临的挑战主要集中在两个方面。首先,由于MQTT协议的特殊性,区分MQTT攻击与正常操作变得尤为复杂,因为攻击可能利用与正常通信相同的命令。其次,数据集的构建过程中,研究人员需要模拟真实的网络环境,确保数据的真实性和多样性,这涉及到复杂的网络模拟和攻击生成技术。此外,如何有效地提取和利用数据中的特征,特别是流特征,以提高检测模型的准确性和鲁棒性,也是当前研究的重要课题。
常用场景
经典使用场景
MQTT-IoT-IDS2020数据集的经典使用场景主要集中在物联网(IoT)网络中的入侵检测系统(IDS)研究。该数据集通过模拟真实的MQTT网络环境,包含了正常操作和四种攻击场景的数据,为研究人员提供了丰富的实验材料。通过分析数据集中的包级、单向流和双向流特征,研究者能够评估和优化基于机器学习(ML)的入侵检测模型,从而提高MQTT网络的安全性。
实际应用
在实际应用中,MQTT-IoT-IDS2020数据集为物联网设备制造商和网络运营商提供了宝贵的资源。通过利用该数据集训练的入侵检测模型,可以实时监控和分析MQTT网络流量,及时发现并阻止潜在的攻击行为。这不仅有助于保护关键基础设施,如智能城市、医疗系统和工业控制系统,还能提升用户体验,确保物联网设备的稳定运行。
衍生相关工作
基于MQTT-IoT-IDS2020数据集,研究者们已经开展了一系列相关工作。例如,有研究通过该数据集评估了多种机器学习技术在MQTT网络入侵检测中的性能,发现流级特征在区分MQTT攻击与正常流量方面具有显著优势。此外,还有研究利用该数据集开发了新的特征提取方法和分类算法,进一步提升了入侵检测的准确性和效率。这些衍生工作不仅丰富了物联网安全领域的研究成果,也为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作