five

CICIoT2023Small

收藏
Hugging Face2026-05-03 更新2026-05-04 收录
下载链接:
https://huggingface.co/datasets/somnath0100/CICIoT2023Small
下载链接
链接失效反馈
官方服务:
资源简介:
CICIoT2023数据集是原始CICIoT2023流量收集的处理衍生版本,包含截断的PCAP文件和基于流的CSV提取数据。数据集按照原始CICResearch文件夹层次结构进行组织,分为PCAPS/和CSVS/两个主要目录,分别存放处理后的PCAP和CSV文件。数据集覆盖了308个源链接,所有条目均已完全处理,包含PCAP和CSV两种格式。数据内容涉及多种网络攻击类型,如后门恶意软件、浏览器劫持、命令注入以及多种DDoS攻击(如ACK分片、HTTP洪水、ICMP洪水等),同时也包含良性流量样本。该数据集适用于网络安全、入侵检测、物联网设备行为分析等研究任务。

The CICIoT2023 dataset is a processed derivative version of the original CICIoT2023 traffic collection, containing truncated PCAP files and flow-based CSV extracted data. The dataset is organized according to the original CICResearch folder hierarchy, divided into two main directories: PCAPS/ and CSVS/, which store the processed PCAP and CSV files respectively. The dataset covers 308 source links, with all entries fully processed and available in both PCAP and CSV formats. The data includes various types of network attacks, such as backdoor malware, browser hijacking, command injection, and various DDoS attacks (e.g., ACK fragmentation, HTTP flood, ICMP flood), as well as benign traffic samples. This dataset is suitable for research tasks in network security, intrusion detection, and IoT device behavior analysis.
创建时间:
2026-05-02
原始信息汇总

好的,这是根据您提供的数据集详情页面内容总结的概述:

CICIoT2023 数据集概述

基本信息

  • 数据集名称: CICIoT2023 Processed Network Flows and Truncated PCAPs
  • 语言: 英语
  • 许可证: 其他(非标准开源许可)
  • 任务类别: 表格分类

数据集描述

该数据集是 CICIoT2023 流量采集的一个处理衍生版本。它整理了截断后的 PCAP 文件和基于流的 CSV 提取文件,这些文件与原始 CICResearch 文件夹层次结构保持一致。

处理流程

数据集的处理流程包含以下四个阶段:

  1. 源数据获取: 从 CICResearch 的 CICIoT2023 门户网站获取原始数据。
  2. 流提取: 使用 TriFlowMeter 工具从完整的 PCAP 文件中提取网络流。
  3. PCAP 缩减: 使用 editcap 工具将 PCAP 数据包的有效载荷截断至 128 字节,以减小文件大小。
  4. 仓库组织: 处理后的文件按照源布局,组织在 PCAPS/...CSVS/... 目录下。

数据覆盖范围

  • 总计源链接数: 308 个
  • 完全处理条目(PCAP 和 CSV 均存在): 308 个
  • 部分处理条目(仅一个工件存在): 0 个
  • 未处理条目: 0 个

数据组织方式

数据主要分为两个目录:

  • PCAPS/: 存放截断后的 PCAP 输出文件。
  • CSVS/: 存放流级别的 CSV 输出文件。

表中的连字符 (-) 表示对应的处理工件当前不存在。

来源映射示例

下表展示了源 PCAP 链接与处理后文件的映射关系。

文件夹 原始 PCAP 链接 HF PCAP 路径 HF CSV 路径 状态
Backdoor_Malware https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FBackdoor_Malware%2FBackdoor_Malware.pcap PCAPS/Backdoor_Malware/Backdoor_Malware.pcap CSVS/Backdoor_Malware/Backdoor_Malware.pcap_Flow.csv Downloaded
Benign_Final https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FBenign_Final%2FBenignTraffic.pcap PCAPS/Benign_Final/BenignTraffic.pcap CSVS/Benign_Final/BenignTraffic.pcap_Flow.csv Downloaded
BrowserHijacking https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FBrowserHijacking%2FBrowserHijacking.pcap PCAPS/BrowserHijacking/BrowserHijacking.pcap CSVS/BrowserHijacking/BrowserHijacking.pcap_Flow.csv Downloaded
CommandInjection https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FCommandInjection%2FCommandInjection.pcap PCAPS/CommandInjection/CommandInjection.pcap CSVS/CommandInjection/CommandInjection.pcap_Flow.csv Downloaded
DDoS-ACK_Fragmentation https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FDDoS-ACK_Fragmentation%2FDDoS-ACK_Fragmentation.pcap PCAPS/DDoS-ACK_Fragmentation/DDoS-ACK_Fragmentation.pcap CSVS/DDoS-ACK_Fragmentation/DDoS-ACK_Fragmentation.pcap_Flow.csv Downloaded
DDoS-HTTP_Flood https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FDDoS-HTTP_Flood%2FDDoS-HTTP_Flood-.pcap PCAPS/DDoS-HTTP_Flood/DDoS-HTTP_Flood-.pcap CSVS/DDoS-HTTP_Flood/DDoS-HTTP_Flood-.pcap_Flow.csv Downloaded
DDoS-ICMP_Flood https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FDDoS-ICMP_Flood%2FDDoS-ICMP_Flood.pcap PCAPS/DDoS-ICMP_Flood/DDoS-ICMP_Flood.pcap CSVS/DDoS-ICMP_Flood/DDoS-ICMP_Flood.pcap_Flow.csv Downloaded
DDoS-ICMP_Fragmentation https://cicresearch.ca/IOTDataset/CIC_IOT_Dataset2023/download.php?file=PCAP%2FDDoS-ICMP_Fragmentation%2FDDoS-ICMP_Fragmentation.pcap PCAPS/DDoS-ICMP_Fragmentation/DDoS-ICMP_Fragmentation.pcap CSVS/DDoS-ICMP_Fragmentation/DDoS-ICMP_Fragmentation.pcap_Flow.csv Downloaded
搜集汇总
数据集介绍
main_image_url
构建方式
CICIoT2023Small数据集源自加拿大网络安全研究院(CIC)公开的CICIoT2023原始流量采集,经过系统化的后处理流程构建而成。该流程从官方门户获取原始PCAP文件后,首先借助TriFlowMeter工具对完整PCAP进行流级特征提取,生成对应的流表CSV文件;继而采用editcap工具将原始数据包载荷截断至128字节,以缩减存储体积;最后按照原始源布局的文件夹层级,将处理后的PCAP和CSV文件分别存放于PCAPS与CSVS目录中,确保数据组织与原结构严格对应。目前全部308个源链接均已完整处理,无部分处理或未处理条目。
特点
该数据集兼具原始网络流量与结构化流表两种形态,为网络安全研究提供了兼顾细节与效率的数据支撑。其PCAP文件经载荷截断处理,在保留关键协议头部信息的同时显著降低存储开销;对应的CSV流表则直接包含由TriFlowMeter导出的多维流量统计特征,便于直接用于基于机器学习的入侵检测建模。数据覆盖良性流量及多种恶意攻击场景(如后门、命令注入、DDoS变种等),类别丰富且分布清晰。完全基于原始CICIoT2023的处理结果确保了数据来源的权威性与可溯源性。
使用方法
研究人员可通过HuggingFace数据集仓库直接访问本数据集,按需加载PCAPS目录下的截断PCAP文件进行深度包分析,或加载CSVS目录下的流特征CSV文件开展分类与异常检测实验。CSV文件可直接利用pandas等库读入DataFrame,结合标签信息进行有监督训练;PCAP文件则可借助Scapy或tshark等工具解析并自定义特征。建议使用者根据具体任务选择合适的模态——例如,对实时性要求高的应用可优先选用CSV特征向量,而需细粒度协议分析的研究则可利用PCAP原始数据。
背景与挑战
背景概述
CICIoT2023Small数据集由加拿大网络安全研究所(CIC)于2023年创建,旨在应对物联网(IoT)环境下日益严峻的网络安全挑战。该数据集聚焦于IoT入侵检测领域,通过系统性地采集和整理IoT网络流量数据,涵盖多种攻击类型(如DDoS、后门恶意软件、命令注入等),为研究人员提供了高质量的基准测试资源。其核心研究问题是如何利用流量特征有效区分正常行为与恶意攻击,从而推动入侵检测系统在资源受限的IoT设备上的部署。自发布以来,该数据集因其全面的攻击覆盖和严谨的数据处理流程,已成为IoT安全领域广泛采用的评估标准,显著促进了相关算法的研发与验证。
当前挑战
CICIoT2023Small数据集面临的核心挑战在于IoT环境下入侵检测的固有复杂性。领域问题层面,IoT设备种类繁多、协议碎片化,导致网络流量模式高度异质,传统基于规则的检测方法难以泛化;同时,新型攻击手法(如零日漏洞利用)的不断涌现要求模型具备实时自适应能力。数据构建层面,原始PCAP文件体积庞大,需通过截断载荷至128字节与流特征提取(TriFlowMeter)来平衡存储效率与分析精度,但截断可能丢失关键攻击载荷信息;此外,308个源链接的完整处理(含PCAP与CSV双重输出)确保数据完备性,但多阶段流程(获取、提取、压缩、归档)的自动化与一致性控制极具挑战,任何环节的偏差均会影响数据质量与可比性。
常用场景
经典使用场景
在物联网安全领域,CICIoT2023Small数据集以其丰富的网络流特征和截断的数据包捕获文件,成为网络入侵检测系统研究的基石。研究者常将其用于构建和评估基于机器学习的入侵检测模型,通过提取流级别的统计特征,实现对DDoS、恶意软件、命令注入等多种攻击行为的高效分类与识别。该数据集涵盖了从良性流量到多种攻击模式的全面覆盖,为模型训练提供了均衡且多样化的样本空间,特别适用于研究特征工程、异常检测算法以及实时入侵响应机制。
解决学术问题
该数据集旨在解决物联网环境下网络攻击识别与分类中样本稀缺、类别不平衡及特征冗余等核心学术难题。通过提供大规模、多类别、标注准确的网络流数据,CICIoT2023Small促进了新型入侵检测算法的开发,尤其是在深度学习与集成学习方法的鲁棒性和泛化能力验证上发挥了关键作用。它的出现推动了物联网安全研究从理论模型向可重复实验的范式转变,为学术界确立了一套标准化、可复现的评估基准。
衍生相关工作
CICIoT2023Small衍生了多项经典工作,例如基于注意力机制的时空特征融合入侵检测模型、对比学习在物联网异常检测中的应用,以及联邦学习框架下的分布式入侵检测系统。许多研究者以其为基准数据集,提出了如流特征压缩网络、图神经网络流图分析等方法。此外,该数据集还催生了一系列专注于数据增强与对抗样本防御的后续研究,成为物联网安全领域影响力广泛的数据驱动研究生态的重要起点。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作