five

EDGE-IIOTSET

收藏
arXiv2025-09-30 收录
下载链接:
https://ieee-dataport.org/documents/edge-iiotset-new-comprehensive-realistic-cyber-security-dataset-iot-and-iiot-applications
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个全面且真实的网络安全数据集,它是在一个专门构建的物联网/工业物联网测试平台上生成的。该数据集包含了超过2000万个正常流量和攻击流量的实例。数据集包括CSV和PCAP文件,拥有超过63个特征,并已经过包括数据清洗、编码以及使用SMOTE算法进行过采样的多个预处理步骤。总体而言,该数据集的规模超过2000万实例,其任务是进行入侵检测。

This is a comprehensive and realistic cybersecurity dataset generated on a purpose-built Internet of Things (IoT)/Industrial Internet of Things (IIoT) testbed. This dataset contains more than 20 million instances of both normal and malicious attack network traffic. It includes both CSV and PCAP files, with over 63 features, and has undergone multiple preprocessing procedures including data cleaning, encoding, and oversampling using the SMOTE algorithm. Overall, with a total of over 20 million instances, this dataset is designed for intrusion detection tasks.
搜集汇总
数据集介绍
main_image_url
构建方式
在物联网与边缘计算安全研究领域,构建一个全面且贴近真实场景的网络入侵检测数据集至关重要。EDGE-IIoTset数据集通过模拟边缘计算环境中的网络流量,精心构建了包含正常流量与14种典型网络攻击类别的多样化样本。其构建过程涵盖了从原始流量捕获、特征提取到标签标注的全流程,最终形成包含61个网络流量特征及攻击类型标签的结构化数据。该数据集采用分层抽样策略确保类别平衡,并通过严格的预处理流程移除冗余信息,为模型训练提供了高质量、高保真的基准数据。
特点
EDGE-IIoTset数据集在网络安全领域展现出鲜明的特色,其核心在于全面覆盖边缘物联网环境中的复杂威胁场景。数据集不仅包含海量的正常网络流量记录,更系统整合了信息收集、中间人攻击、拒绝服务、恶意软件及注入攻击等五大类共14种攻击类型,如SQL注入、勒索软件、端口扫描等,真实反映了边缘网络面临的多维安全挑战。此外,数据集提供了丰富的协议层特征,包括TCP标志、HTTP请求类型、DNS查询等,这些特征能够有效捕捉网络行为的时空模式,为深度学习模型识别细微异常提供了坚实基础。
使用方法
该数据集主要用于训练和评估网络入侵检测模型,尤其适用于多分类场景下的算法性能验证。研究人员通常按照70%、20%、10%的比例划分训练集、测试集和验证集,确保模型评估的可靠性。在使用前,需进行特征编码、标准化以及基于卡方检验的特征选择,以优化数据质量并提升模型效率。数据集可直接应用于时序卷积网络、卷积神经网络与循环神经网络的混合架构等深度学习模型,通过准确率、召回率、F1分数等指标全面评估模型对不同攻击类型的检测能力,从而推动边缘计算安全防护技术的演进。
背景与挑战
背景概述
随着物联网与边缘计算的迅猛发展,网络拓扑结构日益复杂,安全威胁随之加剧,亟需高效的入侵检测系统以保障敏感信息。在此背景下,EDGE-IIoTset数据集应运而生,由Ferrag等研究人员于2022年创建,旨在为边缘计算和物联网环境提供一个全面、真实的网络安全基准。该数据集涵盖了正常流量及14种网络攻击类型,包括恶意软件、注入攻击、分布式拒绝服务等,共计61个特征,为深度学习模型在复杂网络入侵检测中的性能评估提供了关键支撑。其广泛的应用显著推动了该领域从传统机器学习向时序深度学习的范式转变,成为相关研究不可或缺的资源。
当前挑战
EDGE-IIoTset数据集所针对的网络入侵检测领域,核心挑战在于如何有效捕捉网络流量中的时序依赖关系,以识别不断演化的复杂攻击模式,例如中间人攻击和高级持续性威胁。传统模型在处理异构流量和实时检测方面存在局限。在数据集构建过程中,挑战同样显著:需在模拟的真实边缘物联网环境中,平衡地生成多种攻击类型与正常流量,确保数据多样性与代表性;同时,特征工程需从原始网络数据中提取具有判别力的时序与统计特征,并处理高维特征间的相关性,以构建适用于深度学习模型的高质量基准。
常用场景
经典使用场景
在物联网与边缘计算安全领域,EDGE-IIoTset数据集常被用于评估和验证网络入侵检测模型的性能。该数据集模拟了真实边缘环境中的网络流量,包含正常流量及14类典型网络攻击,如DDoS、恶意软件、中间人攻击等,为研究者提供了一个全面且贴近实际的基准测试平台。通过在该数据集上训练和测试,模型能够学习复杂网络行为模式,进而提升对多样化攻击的检测能力,尤其在处理时序依赖和异构流量方面展现出显著优势。
解决学术问题
EDGE-IIoTset数据集有效解决了边缘计算环境中网络入侵检测的若干关键学术问题。传统方法往往难以捕捉网络流量中的时序依赖和复杂模式,而该数据集通过提供丰富的多类攻击样本,支持深度学习模型如时序卷积网络(TCN)进行高效训练,从而提升模型对长程依赖的建模能力。此外,数据集涵盖了从信息收集到恶意注入的多种攻击类型,有助于研究者在单一框架下评估模型对异构威胁的泛化性能,推动了边缘安全领域向更精准、自适应的检测方向发展。
衍生相关工作
围绕EDGE-IIoTset数据集,已衍生出多项经典的网络入侵检测研究工作。例如,研究者利用时序卷积网络(TCN)结合残差块与膨胀卷积,在该数据集上实现了多类分类的高精度检测;同时,混合模型如CNN-LSTM、CNN-GRU等也被广泛探索,以平衡时序建模与计算效率。这些工作不仅验证了数据集在评估模型鲁棒性方面的价值,还推动了轻量级联邦学习框架等新兴方向的发展,为边缘环境下的自适应安全解决方案奠定了理论基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作