19kmunz/iot-23-preprocessed
收藏Hugging Face2023-11-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/19kmunz/iot-23-preprocessed
下载链接
链接失效反馈官方服务:
资源简介:
Aposemat IoT-23数据集包含来自20个恶意网络流量捕获和3个良性流量捕获的数据子集,适用于物联网设备的入侵检测系统。数据集的特征信息来源于Zeek处理,包括端口号、协议类型、连接持续时间、发送的字节数等。数据集适用于二分类任务,标签为恶意或良性。
The Aposemat IoT-23 dataset comprises data subsets sourced from 20 malicious network traffic captures and 3 benign network traffic captures, and is tailored for intrusion detection systems targeting IoT devices. The feature information of the dataset is extracted via Zeek analysis, covering port numbers, protocol types, connection duration, the number of transmitted bytes, and other relevant metrics. This dataset is suitable for binary classification tasks, with the labels being either malicious or benign.
提供机构:
19kmunz
原始信息汇总
数据集概述
数据集信息
特征信息
- id.orig_p: 发起方的端口号,数据类型为
int64。 - id.resp_p: 响应方的端口号,数据类型为
int64。 - proto: 连接的传输层协议,数据类型为
string。 - service: 连接上发送的应用程序协议标识,数据类型为
string。 - duration: 连接持续时间,数据类型为
float64。 - orig_bytes: 发起方发送的有效载荷字节数,数据类型为
int64。 - resp_bytes: 响应方发送的有效载荷字节数,数据类型为
int64。 - conn_state: 连接状态值,数据类型为
string。 - missed_bytes: 内容间隙中丢失的字节数,数据类型为
int64。 - history: 连接状态历史记录,数据类型为
string。 - orig_pkts: 发起方发送的数据包数量,数据类型为
int64。 - orig_ip_bytes: 发起方发送的IP级别字节数,数据类型为
int64。 - resp_pkts: 响应方发送的数据包数量,数据类型为
int64。 - resp_ip_bytes: 响应方发送的IP级别字节数,数据类型为
int64。 - label: 数据点是良性还是某种形式的恶意,数据类型为
string。
数据分割
- train: 训练集,包含 93,994,789 字节,819,024 个样本。
数据集大小
- 下载大小: 11,805,369 字节
- 数据集大小: 93,994,789 字节
配置
- default: 数据文件路径为
data/train-*。
任务类别
- 问答
- 表格分类
语言
- 英语
标签
- code
美观名称
- d
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是物联网网络流量分析的预处理子集,包含81.9万条标记为恶意或良性的网络连接记录,适用于二进制分类任务。数据保留了端口号、协议类型、数据包大小等关键网络特征,但移除了时间戳和IP地址以避免过拟合。
以上内容由遇见数据集搜集并总结生成



