five

c01dsnap/CIC-IDS2017|网络安全数据集|入侵检测数据集

收藏
hugging_face2023-11-30 更新2024-03-04 收录
网络安全
入侵检测
下载链接:
https://hf-mirror.com/datasets/c01dsnap/CIC-IDS2017
下载链接
链接失效反馈
资源简介:
CICIDS2017数据集由标记的网络流组成,包括pcap格式的完整数据包负载、相应的配置文件以及用于机器学习和深度学习的CSV文件。该数据集公开提供给研究人员使用。使用该数据集时,应引用相关论文,该论文详细描述了数据集及其基本原理。

CICIDS2017数据集由标记的网络流组成,包括pcap格式的完整数据包负载、相应的配置文件以及用于机器学习和深度学习的CSV文件。该数据集公开提供给研究人员使用。使用该数据集时,应引用相关论文,该论文详细描述了数据集及其基本原理。
提供机构:
c01dsnap
原始信息汇总

CICIDS2017 数据集概述

数据集内容

  • 数据类型:包含标记的网络流量数据,包括完整的包负载(pcap格式)、相应的配置文件和标记的流量(GeneratedLabelledFlows.zip)以及用于机器学习和深度学习的CSV文件(MachineLearningCSV.zip)。

数据集用途

  • 公开可用性:该数据集对研究人员公开可用。

引用要求

  • 引用文献:使用该数据集时,应引用相关论文,该论文详细介绍了数据集及其基本原理。
    • 论文信息
      • 作者:Iman Sharafaldin, Arash Habibi Lashkari, Ali A. Ghorbani
      • 标题:“Toward Generating a New Intrusion Detection Dataset and Intrusion Traffic Characterization”
      • 会议:4th International Conference on Information Systems Security and Privacy (ICISSP)
      • 地点:Portugal
      • 时间:January 2018
AI搜集汇总
数据集介绍
main_image_url
构建方式
CIC-IDS2017数据集的构建基于网络流量分析,通过捕获和标记网络流量,生成包含完整数据包负载的pcap格式文件。此外,该数据集还包括用于机器学习和深度学习的CSV文件,这些文件经过精心处理,以确保研究者能够有效地利用这些数据进行模型训练和评估。
特点
CIC-IDS2017数据集的显著特点在于其包含了详细的网络流量标签,这使得研究者能够进行精确的入侵检测和流量特征分析。此外,数据集的多样性和全面性为不同类型的网络攻击提供了丰富的样本,从而增强了模型的泛化能力。
使用方法
使用CIC-IDS2017数据集时,研究者可以利用提供的pcap文件进行深入的网络流量分析,或直接使用CSV文件进行机器学习和深度学习模型的训练。为了确保研究的科学性和可重复性,建议在使用该数据集时引用相关的研究论文,以获取更详细的构建和使用指南。
背景与挑战
背景概述
CIC-IDS2017数据集由Iman Sharafaldin、Arash Habibi Lashkari和Ali A. Ghorbani于2018年创建,旨在为网络入侵检测系统提供一个全面且标注详尽的数据集。该数据集包含了网络流量中的完整数据包负载,以pcap格式存储,并提供了相应的标注流量和CSV文件,便于机器学习和深度学习研究。通过在第四届国际信息系统安全与隐私会议(ICISSP)上发表的论文,研究人员详细阐述了数据集的生成过程及其背后的原理,为网络安全领域的研究提供了宝贵的资源。
当前挑战
CIC-IDS2017数据集在构建过程中面临了多重挑战。首先,生成一个包含完整数据包负载的网络流量数据集需要高度精确的标注,以确保数据的真实性和可靠性。其次,数据集的规模和复杂性要求研究人员在处理和存储大量数据时具备高效的技术手段。此外,为了使数据集适用于机器学习和深度学习模型,研究人员还需确保数据格式的标准化和一致性。这些挑战不仅影响了数据集的构建过程,也对后续的研究和应用提出了更高的要求。
常用场景
经典使用场景
CIC-IDS2017数据集在网络安全领域中被广泛用于入侵检测系统的开发与评估。该数据集包含了详细的网络流量数据,包括完整的包负载和相应的标签,为研究人员提供了丰富的资源以训练和测试机器学习与深度学习模型。通过分析这些数据,研究者能够构建出更为精准和高效的入侵检测算法,从而提升网络防御能力。
衍生相关工作
基于CIC-IDS2017数据集,研究者们开展了一系列相关工作,推动了入侵检测技术的发展。例如,有研究利用该数据集开发了基于深度学习的入侵检测模型,显著提升了检测的准确率和响应速度。此外,还有研究探讨了如何利用该数据集进行网络流量特征提取和异常检测,为网络安全领域的进一步研究提供了新的思路和方法。这些衍生工作不仅丰富了数据集的应用场景,也促进了网络安全技术的创新与进步。
数据集最近研究
最新研究方向
在网络安全领域,CIC-IDS2017数据集因其丰富的网络流量数据和详细的标签信息,成为研究入侵检测系统的重要资源。最新研究方向主要集中在利用深度学习和机器学习技术,提升入侵检测的准确性和实时性。研究者们通过分析数据集中的全包载荷和流量特征,探索新型攻击模式的识别方法,并致力于构建更为智能和自适应的入侵检测模型。这些研究不仅推动了网络安全技术的发展,也为实际应用中的威胁检测提供了强有力的支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

全国 1∶200 000 数字地质图(公开版)空间数据库

As the only one of its kind, China National Digital Geological Map (Public Version at 1∶200 000 scale) Spatial Database (CNDGM-PVSD) is based on China' s former nationwide measured results of regional geological survey at 1∶200 000 scale, and is also one of the nationwide basic geosciences spatial databases jointly accomplished by multiple organizations of China. Spatially, it embraces 1 163 geological map-sheets (at scale 1: 200 000) in both formats of MapGIS and ArcGIS, covering 72% of China's whole territory with a total data volume of 90 GB. Its main sources is from 1∶200 000 regional geological survey reports, geological maps, and mineral resources maps with an original time span from mid-1950s to early 1990s. Approved by the State's related agencies, it meets all the related technical qualification requirements and standards issued by China Geological Survey in data integrity, logic consistency, location acc racy, attribution fineness, and collation precision, and is hence of excellent and reliable quality. The CNDGM-PVSD is an important component of China' s national spatial database categories, serving as a spatial digital platform for the information construction of the State's national economy, and providing informationbackbones to the national and provincial economic planning, geohazard monitoring, geological survey, mineral resources exploration as well as macro decision-making.

DataCite Commons 收录

Traditional-Chinese-Medicine-Dataset-SFT

该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。

huggingface 收录

NWPU VHR-10 dataset

NWPU VHR-10数据集是一个包含10个类别地理空间目标检测的挑战性数据集。该数据集共包含800张VHR光学遥感图像,其中715张彩色图像来自Google Earth,空间分辨率在0.5至2米之间,85张全色锐化彩色红外图像来自Vaihingen数据,空间分辨率为0.08米。数据集分为两部分:a) 正图像集,包含至少一个目标的650张图像;b) 负图像集,包含150张不包含任何目标的图像。从正图像集中,手动标注了757架飞机、302艘船只、655个储罐、390个棒球场、524个网球场、159个篮球场、163个田径场、224个港口、124座桥梁和477辆车辆,使用边界框和实例掩码作为地面实况。

github 收录