Alttek/tfg_nsl_kdd
收藏Hugging Face2024-05-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Alttek/tfg_nsl_kdd
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: same_srv_rate
dtype: float64
- name: dst_host_same_src_port_rate
dtype: float64
- name: dst_host_serror_rate
dtype: float64
- name: dst_host_same_srv_rate
dtype: float64
- name: dst_host_srv_count
dtype: float64
- name: dst_host_srv_serror_rate
dtype: float64
- name: srv_serror_rate
dtype: float64
- name: dst_host_diff_srv_rate
dtype: float64
- name: serror_rate
dtype: float64
- name: count
dtype: float64
- name: rerror_rate
dtype: float64
- name: wrong_fragment
dtype: float64
- name: dst_host_rerror_rate
dtype: float64
- name: dst_host_count
dtype: float64
- name: service
dtype: float64
- name: dst_host_srv_rerror_rate
dtype: float64
- name: logged_in
dtype: float64
- name: diff_srv_rate
dtype: float64
- name: srv_diff_host_rate
dtype: float64
- name: srv_rerror_rate
dtype: float64
- name: Label
dtype: int64
splits:
- name: train
num_bytes: 15543255.9974059
num_examples: 92517
- name: eval
num_bytes: 3885940.0025941012
num_examples: 23130
download_size: 3239852
dataset_size: 19429196.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: eval
path: data/eval-*
---
This dataset includes multiple features related to network services, such as same service rate, destination host same source port rate, etc., all of which are of float64 type. Additionally, there is a label feature for classification, which is of int64 type. The dataset is divided into a training set and an evaluation set, containing 92517 and 23130 samples respectively. The download size of the dataset is 3239852 bytes, and the total size is 19429196.0 bytes. The dataset configuration is default, including paths for training and evaluation data files.
提供机构:
Alttek
原始信息汇总
数据集概述
数据集特征
- same_srv_rate:数据类型为
float64。 - dst_host_same_src_port_rate:数据类型为
float64。 - dst_host_serror_rate:数据类型为
float64。 - dst_host_same_srv_rate:数据类型为
float64。 - dst_host_srv_count:数据类型为
float64。 - dst_host_srv_serror_rate:数据类型为
float64。 - srv_serror_rate:数据类型为
float64。 - dst_host_diff_srv_rate:数据类型为
float64。 - serror_rate:数据类型为
float64。 - count:数据类型为
float64。 - rerror_rate:数据类型为
float64。 - wrong_fragment:数据类型为
float64。 - dst_host_rerror_rate:数据类型为
float64。 - dst_host_count:数据类型为
float64。 - service:数据类型为
float64。 - dst_host_srv_rerror_rate:数据类型为
float64。 - logged_in:数据类型为
float64。 - diff_srv_rate:数据类型为
float64。 - srv_diff_host_rate:数据类型为
float64。 - srv_rerror_rate:数据类型为
float64。 - Label:数据类型为
int64。
数据集分割
- 训练集(train):包含92517个样本,总大小为15543255.9974059字节。
- 评估集(eval):包含23130个样本,总大小为3885940.0025941012字节。
数据集大小
- 下载大小:3239852字节。
- 数据集总大小:19429196.0字节。
数据文件配置
- 默认配置(default):
- 训练集路径:
data/train-* - 评估集路径:
data/eval-*
- 训练集路径:
搜集汇总
数据集介绍

构建方式
Alttek/tfg_nsl_kdd数据集的构建,是基于网络流量行为的特征提取,其涵盖了诸如服务访问频率、错误率、登录状态等多个维度。数据集的构建者通过对原始网络流量数据进行细致的特征工程,提取出20个关键特征,并以此形成了训练与评估所需的格式化数据集。
使用方法
使用Alttek/tfg_nsl_kdd数据集,用户首先需要下载并解压数据集文件。随后,可以通过数据集提供的训练集和评估集进行模型的训练和验证。数据集以HuggingFace的Dataset格式组织,支持通过其库直接加载和预处理数据,便于用户进行高效的特征工程和模型开发。
背景与挑战
背景概述
Alttek/tfg_nsl_kdd数据集,诞生于网络安全领域的研究沃土之中,由Alttek团队精心构建。该数据集的核心研究问题是入侵检测,旨在通过对网络流量数据的深入分析,有效识别出潜在的恶意行为。自其问世以来,该数据集便成为网络安全领域研究的一个重要基准,为学术界和工业界的研究人员提供了一个共同的研究平台,推动了该领域的技术进步和理论发展。
当前挑战
该数据集所面临的挑战主要体现在两个方面:一是领域问题层面,即如何提高入侵检测的准确性和效率,以应对不断演变的网络攻击手段;二是构建过程中,如何处理海量网络数据,确保数据的质量和多样性,同时兼顾数据标注的准确性和一致性。这些挑战对于数据集的实用性和研究价值提出了更高的要求。
常用场景
经典使用场景
在网络安全领域,Alttek/tfg_nsl_kdd数据集以其对网络入侵行为的详细记录而成为研究者的首选。该数据集广泛用于构建和评估入侵检测系统,其特征涵盖了服务访问频率、错误率等多个维度,为机器学习模型的训练提供了丰富的信息基础。
解决学术问题
该数据集有效解决了网络入侵检测中的分类问题,帮助学者们探索如何通过特征工程和模型选择来提高检测的准确性。其标准化和清洗的数据特性,使得研究者能够专注于算法优化,而非数据预处理,从而推动了学术研究的深入。
实际应用
Alttek/tfg_nsl_kdd数据集在现实世界的应用场景中,如网络安全监控、异常检测等领域发挥了重要作用。企业利用该数据集训练出的模型,能够实时监控网络流量,及时发现并响应潜在的安全威胁。
数据集最近研究
最新研究方向
在网络安全领域,Alttek/tfg_nsl_kdd数据集因其对入侵检测的精确性而备受关注。近期研究聚焦于利用该数据集对异常流量进行深度学习分析,以提升网络威胁的识别效率。此数据集包含了多种网络流量特征,为构建高效的特征选择模型和分类算法提供了坚实基础。研究人员正致力于挖掘数据集中的深层次模式,以实现对未知攻击类型的提前预警,这对于维护网络安全具有深远的影响。
以上内容由遇见数据集搜集并总结生成



