five

kirayz/cicids17-ml

收藏
Hugging Face2024-06-22 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/kirayz/cicids17-ml
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集最初出现在CIC-IDS 2017中。该数据集未经过任何清洗阶段,我们仅确保所有行包含有效数据且所有特征命名正确。

This is the dataset originally appeared in cic-ids 2017. This dataset has not gone through any cleaning stages. We simply made sure that all rows contain valid data and all features are named property.
提供机构:
kirayz
原始信息汇总

数据集概述

数据集名称

cic-ids-2017-machine-learning-cve

数据集特征

  • destination_port: 目标端口,数据类型为 int64
  • flow_duration: 流持续时间,数据类型为 int64
  • total_fwd_packets: 前向总包数,数据类型为 int64
  • total_backward_packets: 后向总包数,数据类型为 int64
  • total_length_of_fwd_packets: 前向包总长度,数据类型为 int64
  • total_length_of_bwd_packets: 后向包总长度,数据类型为 int64
  • fwd_packet_length_max: 前向包最大长度,数据类型为 int64
  • fwd_packet_length_min: 前向包最小长度,数据类型为 int64
  • fwd_packet_length_mean: 前向包平均长度,数据类型为 float64
  • fwd_packet_length_std: 前向包长度标准差,数据类型为 float64
  • bwd_packet_length_max: 后向包最大长度,数据类型为 int64
  • bwd_packet_length_min: 后向包最小长度,数据类型为 int64
  • bwd_packet_length_mean: 后向包平均长度,数据类型为 float64
  • bwd_packet_length_std: 后向包长度标准差,数据类型为 float64
  • flow_bytes/s: 流字节每秒,数据类型为 float64
  • flow_packets/s: 流包每秒,数据类型为 float64
  • flow_iat_mean: 流间隔平均值,数据类型为 float64
  • flow_iat_std: 流间隔标准差,数据类型为 float64
  • flow_iat_max: 流间隔最大值,数据类型为 int64
  • flow_iat_min: 流间隔最小值,数据类型为 int64
  • fwd_iat_total: 前向间隔总和,数据类型为 int64
  • fwd_iat_mean: 前向间隔平均值,数据类型为 float64
  • fwd_iat_std: 前向间隔标准差,数据类型为 float64
  • fwd_iat_max: 前向间隔最大值,数据类型为 int64
  • fwd_iat_min: 前向间隔最小值,数据类型为 int64
  • bwd_iat_total: 后向间隔总和,数据类型为 int64
  • bwd_iat_mean: 后向间隔平均值,数据类型为 float64
  • bwd_iat_std: 后向间隔标准差,数据类型为 float64
  • bwd_iat_max: 后向间隔最大值,数据类型为 int64
  • bwd_iat_min: 后向间隔最小值,数据类型为 int64
  • fwd_psh_flags: 前向PSH标志,数据类型为 int64
  • bwd_psh_flags: 后向PSH标志,数据类型为 int64
  • fwd_urg_flags: 前向URG标志,数据类型为 int64
  • bwd_urg_flags: 后向URG标志,数据类型为 int64
  • fwd_header_length: 前向头长度,数据类型为 int64
  • bwd_header_length: 后向头长度,数据类型为 int64
  • fwd_packets/s: 前向包每秒,数据类型为 float64
  • bwd_packets/s: 后向包每秒,数据类型为 float64
  • min_packet_length: 最小包长度,数据类型为 int64
  • max_packet_length: 最大包长度,数据类型为 int64
  • packet_length_mean: 包长度平均值,数据类型为 float64
  • packet_length_std: 包长度标准差,数据类型为 float64
  • packet_length_variance: 包长度方差,数据类型为 float64
  • fin_flag_count: FIN标志计数,数据类型为 int64
  • syn_flag_count: SYN标志计数,数据类型为 int64
  • rst_flag_count: RST标志计数,数据类型为 int64
  • psh_flag_count: PSH标志计数,数据类型为 int64
  • ack_flag_count: ACK标志计数,数据类型为 int64
  • urg_flag_count: URG标志计数,数据类型为 int64
  • cwe_flag_count: CWE标志计数,数据类型为 int64
  • ece_flag_count: ECE标志计数,数据类型为 int64
  • down/up_ratio: 下行/上行比率,数据类型为 int64
  • average_packet_size: 平均包大小,数据类型为 float64
  • avg_fwd_segment_size: 前向平均段大小,数据类型为 float64
  • avg_bwd_segment_size: 后向平均段大小,数据类型为 float64
  • fwd_header_length.1: 前向头长度(重复),数据类型为 int64
  • fwd_avg_bytes/bulk: 前向平均字节/批量,数据类型为 int64
  • fwd_avg_packets/bulk: 前向平均包/批量,数据类型为 int64
  • fwd_avg_bulk_rate: 前向平均批量速率,数据类型为 int64
  • bwd_avg_bytes/bulk: 后向平均字节/批量,数据类型为 int64
  • bwd_avg_packets/bulk: 后向平均包/批量,数据类型为 int64
  • bwd_avg_bulk_rate: 后向平均批量速率,数据类型为 int64
  • subflow_fwd_packets: 子流前向包数,数据类型为 int64
  • subflow_fwd_bytes: 子流前向字节数,数据类型为 int64
  • subflow_bwd_packets: 子流后向包数,数据类型为 int64
  • subflow_bwd_bytes: 子流后向字节数,数据类型为 int64
  • init_win_bytes_forward: 前向初始窗口字节数,数据类型为 int64
  • init_win_bytes_backward: 后向初始窗口字节数,数据类型为 int64
  • act_data_pkt_fwd: 前向活动数据包数,数据类型为 int64
  • min_seg_size_forward: 前向最小段大小,数据类型为 int64
  • active_mean: 活动平均值,数据类型为 float64
  • active_std: 活动标准差,数据类型为 float64
  • active_max: 活动最大值,数据类型为 int64
  • active_min: 活动最小值,数据类型为 int64
  • idle_mean: 空闲平均值,数据类型为 float64
  • idle_std: 空闲标准差,数据类型为 float64
  • idle_max: 空闲最大值,数据类型为 int64
  • idle_min: 空闲最小值,数据类型为 int64
  • label: 标签,数据类型为 string

数据集分割

  • train: 训练集,包含 2830743 个样本,总字节数为 1795553965

数据集大小

  • 下载大小: 462120623 字节
  • 数据集大小: 1795553965 字节

数据集配置

  • default: 默认配置,包含训练集数据文件路径为 data/train-*

许可证

  • apache-2.0

标签

  • networking

数据集别名

  • cic-ids-2017-ml-cve

数据集规模

  • 1M<n<10M
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作