five

Alttek/tfg-unswnb15

收藏
Hugging Face2024-05-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Alttek/tfg-unswnb15
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: dmeansz dtype: float64 - name: ct_state_ttl dtype: float64 - name: proto dtype: float64 - name: dwin dtype: float64 - name: Dload dtype: float64 - name: ct_src_dport_ltm dtype: float64 - name: tcprtt dtype: float64 - name: swin dtype: float64 - name: Sjit dtype: float64 - name: ct_dst_ltm dtype: float64 - name: Sload dtype: float64 - name: ct_dst_src_ltm dtype: float64 - name: state dtype: float64 - name: Dpkts dtype: float64 - name: Spkts dtype: float64 - name: sttl dtype: float64 - name: ct_dst_sport_ltm dtype: float64 - name: Japan dtype: float64 - name: United States dtype: float64 - name: private range dtype: float64 - name: reserved range dtype: float64 - name: Label dtype: int64 splits: - name: train num_bytes: 643747456.0 num_examples: 3657656 - name: eval num_bytes: 160937040.0 num_examples: 914415 download_size: 198880984 dataset_size: 804684496.0 configs: - config_name: default data_files: - split: train path: data/train-* - split: eval path: data/eval-* ---

This dataset includes various features related to network traffic, such as average packet size, connection state time, protocol type, etc. It is divided into training and evaluation sets, used for network traffic analysis and anomaly detection.
提供机构:
Alttek
原始信息汇总

数据集概述

数据集特征

  • dmeansz: float64
  • ct_state_ttl: float64
  • proto: float64
  • dwin: float64
  • Dload: float64
  • ct_src_dport_ltm: float64
  • tcprtt: float64
  • swin: float64
  • Sjit: float64
  • ct_dst_ltm: float64
  • Sload: float64
  • ct_dst_src_ltm: float64
  • state: float64
  • Dpkts: float64
  • Spkts: float64
  • sttl: float64
  • ct_dst_sport_ltm: float64
  • Japan: float64
  • United States: float64
  • private range: float64
  • reserved range: float64
  • Label: int64

数据集分割

  • train:
    • 数据量: 643747456.0 字节
    • 样本数: 3657656
  • eval:
    • 数据量: 160937040.0 字节
    • 样本数: 914415

数据集大小

  • 下载大小: 198880984 字节
  • 数据集总大小: 804684496.0 字节

数据文件配置

  • default:
    • train: data/train-*
    • eval: data/eval-*
搜集汇总
数据集介绍
main_image_url
构建方式
Alttek/tfg-unswnb15数据集的构建基于网络流量分析,通过收集和处理大量的网络数据包,提取出关键的网络特征,如数据包大小、传输时间、协议类型等。这些特征经过标准化处理后,被转换为数值型数据,并分配到训练集和评估集中。训练集包含3657656个样本,评估集包含914415个样本,确保了数据集的平衡性和代表性。
特点
该数据集的显著特点在于其丰富的网络流量特征和精细的标签分类。数据集包含了多种网络协议、状态和地理位置相关的特征,如dmeansz、ct_state_ttl、proto等,这些特征为网络流量分析提供了详尽的信息。此外,数据集还包含了地理位置和IP地址范围的特征,增强了其在全球网络流量分析中的应用潜力。
使用方法
Alttek/tfg-unswnb15数据集适用于多种网络流量分析任务,包括但不限于网络入侵检测、流量分类和异常检测。用户可以通过加载数据集的训练和评估部分,利用这些特征进行模型训练和验证。数据集的特征设计使得它能够支持多种机器学习算法,如决策树、随机森林和深度学习模型。通过合理的数据预处理和特征选择,用户可以构建高效的网络流量分析模型。
背景与挑战
背景概述
在网络安全领域,网络流量分析是识别和防御恶意活动的关键手段。Alttek/tfg-unswnb15数据集由Alttek团队创建,旨在为网络流量分析提供一个标准化的数据集。该数据集包含了多种网络流量特征,如数据包大小、连接状态、协议类型等,以及相应的标签,用于区分正常和恶意流量。该数据集的创建时间不详,但其主要研究人员或机构为Alttek,核心研究问题是如何通过机器学习模型有效区分网络中的正常与恶意流量。该数据集对网络安全领域的研究具有重要影响力,为研究人员提供了一个标准化的测试平台,促进了网络流量分析技术的发展。
当前挑战
Alttek/tfg-unswnb15数据集在解决网络流量分类问题时面临多项挑战。首先,数据集中的特征多样且复杂,如何选择和提取有效特征以提高分类模型的性能是一个重要挑战。其次,网络流量数据通常具有高维度和高噪声特性,这增加了模型训练的难度。此外,数据集的构建过程中,如何确保数据的代表性和平衡性,避免样本偏差,也是一个关键问题。最后,随着网络攻击手段的不断演变,数据集需要不断更新以保持其时效性和有效性。
常用场景
经典使用场景
在网络安全领域,Alttek/tfg-unswnb15数据集被广泛用于网络流量分析和入侵检测系统的开发。该数据集通过提供详细的网络流量特征,如数据包大小、连接状态和协议类型等,帮助研究人员和工程师构建高效的入侵检测模型。这些模型能够识别异常流量模式,从而及时发现潜在的网络攻击行为。
解决学术问题
Alttek/tfg-unswnb15数据集解决了网络安全领域中关于入侵检测的多个关键学术问题。通过提供丰富的网络流量特征和标签数据,该数据集支持研究人员开发和验证新的入侵检测算法。这不仅推动了入侵检测技术的发展,还为网络安全领域的理论研究提供了坚实的基础。
衍生相关工作
基于Alttek/tfg-unswnb15数据集,研究人员开发了多种先进的入侵检测模型和算法。例如,一些研究工作利用深度学习技术,如卷积神经网络(CNN)和长短期记忆网络(LSTM),来提高入侵检测的准确性和效率。此外,该数据集还促进了跨领域的研究,如结合自然语言处理技术进行网络日志分析,进一步提升了网络安全的整体水平。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作