five

Mireu-Lab/CIC-IDS

收藏
Hugging Face2023-10-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Mireu-Lab/CIC-IDS
下载链接
链接失效反馈
官方服务:
资源简介:
CIC-IDS数据集是一个包含多种网络攻击类型记录的数据集。数据集中列出了不同类型的攻击,如DDoS、Web_Attack、Infiltration等,并提供了攻击尝试的百分比。数据集由多个文件组成,每个文件对应不同的攻击方式和攻击权重。数据集还包括完整的网络流量数据包(pcap格式)、相应的配置文件以及用于机器学习和深度学习的CSV文件。

The CIC-IDS dataset is a curated collection of records encompassing diverse network attack types. It enumerates distinct attack categories such as DDoS, Web_Attack, Infiltration, and others, and provides the percentage of attack attempts. The dataset consists of multiple files, each corresponding to different attack modalities and their respective attack weights. Additionally, it includes complete network traffic packets in PCAP format, corresponding configuration files, as well as CSV files tailored for machine learning and deep learning applications.
提供机构:
Mireu-Lab
原始信息汇总

CIC-IDS 数据集概述

数据集描述

CIC-IDS 数据集是一个用于分类网络攻击的多轨道数据集。

攻击类型

数据集中包含的攻击类型如下:

  • DDoS
  • Web_Attack_Brute_Force
  • Infiltration
  • DoS_GoldenEye
  • DoS_Hulk
  • Heartbleed
  • Bot
  • DoS_Slowhttptest
  • Web_Attack_XSS
  • DoS_slowloris
  • FTP-Patator
  • SSH-Patator
  • Web_Attack_Sql_Injection
  • PortScan

攻击尝试百分比

数据集中攻击尝试的百分比如下图所示: image-20230926151821430

详细攻击率图表

详细攻击率图表如下: <img src="./image-20230926152655774.png" alt="image-20230926152655774" style="zoom:40%;" /> image-20230926152729901

数据文件配置

数据集中的文件配置如下:

文件名 攻击方式 攻击权重 (%)
Friday-WorkingHours-Afternoon-DDos.pcap_ISCX.csv DDoS 56
Tuesday-WorkingHours.pcap_ISCX.csv FTP-Patator, SSH-Patator 3
Friday-WorkingHours-Afternoon-PortScan.pcap_ISCX.csv PortScan 55
Thursday-WorkingHours-Afternoon-Infilteration.pcap_ISCX.csv Infiltration 0.01
Wednesday-workingHours.pcap_ISCX.csv DoS_Hulk, DoS_Slowhttptest, DoS_GoldenEye, Heartbleed, DoS_slowloris 36
Friday-WorkingHours-Morning.pcap_ISCX.csv Bot 1.02
Thursday-WorkingHours-Morning-WebAttacks.pcap_ISCX.csv Web_Attack_XSS, Web_Attack_Brute_Force, Web_Attack_Sql_Injection 1.27
搜集汇总
数据集介绍
main_image_url
构建方式
在网络安全研究领域,高质量的数据集对于入侵检测系统的开发至关重要。CIC-IDS数据集的构建基于真实网络环境的模拟,研究人员通过精心设计的实验场景,捕获了包含多种网络攻击流量的数据包。这些数据涵盖了分布式拒绝服务攻击、端口扫描、网络渗透以及各类Web攻击等十四种常见攻击类型,确保了数据集的全面性和代表性。原始数据以pcap格式保存,并进一步处理为标记的网络流和CSV文件,为机器学习和深度学习任务提供了结构化的输入。
特点
该数据集的核心特点在于其攻击类型的多样性与数据标注的精确性。它不仅包含了从DDoS到SQL注入等多种攻击向量,而且每种攻击的流量比例均经过详细统计,例如DDoS攻击占比高达56%,而渗透攻击仅占0.01%,这种分布反映了真实网络环境中攻击的普遍性差异。数据集提供了完整的网络流记录与对应的攻击标签,支持特征提取与模型训练,其公开可用的CSV格式文件极大便利了学术研究中的直接应用。
使用方法
研究人员在使用CIC-IDS数据集时,可依据其提供的CSV文件进行入侵检测算法的训练与验证。数据集已按攻击类型分割为多个文件,用户可根据需要加载特定攻击场景的数据,例如专注于Web攻击或端口扫描分析。通过提取网络流特征,如流量持续时间、数据包大小与协议类型,并结合标注的攻击类别,能够构建分类模型以识别恶意行为。使用前应引用相关学术论文,确保符合学术规范,并注意数据集的许可协议要求。
背景与挑战
背景概述
随着网络攻击手段的日益复杂化,入侵检测系统(IDS)的研究对高质量数据集的需求愈发迫切。在此背景下,加拿大网络安全研究所(CIC)于2018年发布了CIC-IDS2017数据集,由Iman Sharafaldin、Arash Habibi Lashkari和Ali A. Ghorbani等学者主导构建。该数据集旨在模拟真实网络环境中的多种攻击流量,涵盖DDoS、端口扫描、Web攻击及渗透等十四类攻击模式,为入侵检测算法的训练与评估提供了标准化基准。其细致标注的网络流数据与完整数据包载荷,显著推动了机器学习在网络安全领域的应用,成为该领域广泛引用的关键资源之一。
当前挑战
在入侵检测领域,传统数据集常因攻击类型单一或流量特征失真而难以反映现实威胁的全貌。CIC-IDS2017数据集直面这一挑战,通过整合多样化的攻击场景,如低比例的渗透攻击与高频率的DDoS攻击,旨在解决模型在复杂多类攻击下的泛化能力问题。构建过程中,研究团队需克服攻击流量与正常流量平衡性的技术难题,确保数据采集环境的高度可控性与真实性,同时处理大规模网络流数据的标注与格式统一,以保障数据集的可靠性与可用性。
常用场景
经典使用场景
在网络安全研究领域,CIC-IDS数据集作为网络入侵检测系统(IDS)开发与评估的基准资源,其经典使用场景聚焦于机器学习与深度学习模型的训练与验证。该数据集通过模拟真实网络环境中的多样化攻击流量,如DDoS、端口扫描和Web攻击等,为研究者提供了丰富的标注数据流,支持从特征提取到分类模型构建的全流程实验。借助其结构化的CSV文件格式,研究人员能够便捷地实施数据预处理、模型训练及性能评估,从而系统性地探索入侵检测算法的有效性与鲁棒性。
实际应用
在实际应用层面,CIC-IDS数据集被广泛部署于企业安全运维与网络安全教育中。安全工程师利用该数据集训练的自适应检测模型,能够实时识别并响应网络中的恶意行为,如阻断DDoS攻击或防御SQL注入。同时,在高校与培训机构中,该数据集作为教学案例,帮助学员理解网络攻击特征与防御策略,提升了网络安全人才培养的实践性与时效性。
衍生相关工作
围绕CIC-IDS数据集,学术界衍生出一系列经典研究工作,尤其在基于深度学习的入侵检测模型优化方面成果显著。例如,研究者利用该数据集开发了结合卷积神经网络与长短期记忆网络的混合模型,以提升对时序攻击流量的识别能力;另有工作聚焦于特征选择算法,通过降维技术增强检测效率。这些成果不仅丰富了入侵检测的理论体系,也为后续数据集的构建与评估标准提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作