five

H23Q

收藏
arXiv2022-12-10 更新2024-06-21 收录
下载链接:
https://icsdweb.aegean.gr/awid/other-datasets/H23Q
下载链接
链接失效反馈
官方服务:
资源简介:
H23Q数据集是由爱琴海大学信息与通信系统工程系的研究团队创建,旨在评估HTTP/2、HTTP/3和QUIC协议的安全性。该数据集包含10种不同的攻击类型,总计60个pcap文件,每个文件对应一个攻击在不同服务器上的表现。数据集提供pcap和CSV格式,便于研究者根据特定网络拓扑和配置选择特征子集进行分析。创建过程中使用了包括Azure云基础设施在内的多种资源,确保数据集的真实性和多样性。该数据集主要用于机器学习技术评估,旨在解决新一代HTTP协议的安全问题。

The H23Q dataset was developed by a research team from the Department of Information and Communication Systems Engineering, University of the Aegean, to evaluate the security of HTTP/2, HTTP/3 and QUIC protocols. This dataset covers 10 distinct attack types, with a total of 60 pcap files, each corresponding to the performance of a specific attack across different servers. The dataset is provided in both pcap and CSV formats, enabling researchers to select feature subsets for analysis based on their specific network topologies and configurations. During its development, multiple resources including Azure cloud infrastructure were utilized to ensure the authenticity and diversity of the dataset. Primarily used for the evaluation of machine learning technologies, this dataset aims to address the security challenges of next-generation HTTP protocols.
提供机构:
爱琴海大学信息与通信系统工程系
创建时间:
2022-08-14
搜集汇总
数据集介绍
main_image_url
构建方式
在网络安全领域,HTTP/3协议的安全评估尚处于探索阶段,H23Q数据集的构建旨在填补这一空白。该数据集通过搭建一个包含六种主流HTTP/3服务器的测试环境,模拟真实网络拓扑,利用13台客户端设备生成混合流量。数据采集过程采用Wireshark工具捕获网络数据包,并辅以TLS密钥解密加密流量,最终形成包含正常与恶意流量的60个pcap文件。为确保数据多样性,攻击场景覆盖了十种不同类型的攻击,包括洪水攻击、慢速攻击及协议混淆攻击等,每种攻击均针对所有服务器进行独立记录,从而构建出一个规模达30GB的多格式标注语料库。
特点
H23Q数据集在协议安全研究领域展现出显著的前沿性与实用性。其核心特点在于首次全面涵盖了HTTP/2、HTTP/3及QUIC协议的攻击流量,并提供了详尽的标注信息。数据集不仅包含原始的pcap格式流量记录,还附带了经过处理的CSV文件,其中提取了199个网络特征,为机器学习分析提供了结构化基础。此外,数据集模拟了真实网络环境中的设备多样性与流量随机性,攻击流量既包括高强度的分布式拒绝服务攻击,也涵盖了难以检测的慢速攻击,从而为入侵检测系统的评估提供了多层次的挑战。
使用方法
研究人员可利用H23Q数据集进行多种安全分析任务。首先,通过加载pcap文件,可以深入分析各类攻击在协议层面的特征与行为模式,例如使用流量分析工具观察攻击签名。其次,基于提供的CSV文件与标注信息,可直接应用机器学习算法进行攻击分类或异常检测实验,数据集已预分割为训练集与测试集以支持模型验证。此外,由于数据集包含了TLS解密密钥,用户能够深入检视加密流量内容,从而开发更精细的检测特征。该数据集也为比较不同HTTP协议版本的安全性能提供了基准,助力于新一代网络防御机制的研发。
背景与挑战
背景概述
H23Q数据集由爱琴海大学、欧洲委员会联合研究中心及比雷埃夫斯大学的研究团队于2023年构建,旨在系统评估HTTP/2、HTTP/3及QUIC协议的安全态势。该数据集诞生于QUIC协议于2021年5月正式标准化、HTTP/3于RFC 9114发布后的关键时期,针对新一代网络传输协议安全研究的数据空白问题。研究团队通过搭建包含六种主流HTTP/3服务器的实验环境,系统性地采集了十类攻击流量与正常流量,形成了包含30GB规模的多格式标注数据。该数据集为网络入侵检测、协议安全分析及机器学习模型验证提供了首个面向HTTP/3与QUIC安全评估的基准资源,对推动传输层安全研究范式演进具有里程碑意义。
当前挑战
该数据集致力于解决HTTP/3与QUIC协议安全威胁检测的核心挑战,具体体现在两个维度:在领域问题层面,新型协议引入的流复用、头部压缩机制及UDP传输特性导致传统基于TCP特征的检测方法失效,需开发跨协议层的多维特征提取方案;同时,慢速DDoS攻击在HTTP/3中呈现更隐蔽的流量模式,要求检测模型具备时序异常感知能力。在构建过程中,研究团队面临实验环境复现性挑战,需协调六种异构服务器实现协议一致性配置;此外,攻击流量标注需结合TLS密钥解密与协议帧解析技术,而Azure云平台对MAC地址的匿名化处理进一步增加了流量溯源与特征关联的复杂度。
常用场景
经典使用场景
在网络安全研究领域,H23Q数据集为HTTP/2、HTTP/3及QUIC协议的安全分析提供了关键实验基础。该数据集通过模拟真实网络环境中的多样化攻击流量,如洪水攻击、慢速攻击及协议降级攻击,为研究者构建了评估入侵检测系统(IDS)性能的标准化测试平台。其经典应用场景聚焦于机器学习与深度学习模型的训练与验证,助力开发高效识别新型网络威胁的算法。
实际应用
在实际网络防御体系中,H23Q数据集可直接用于训练下一代入侵检测系统,提升对基于HTTP/3的DDoS攻击、走私攻击等高级威胁的实时识别能力。安全厂商可借助该数据集验证防火墙与负载均衡器对QUIC流量的处理性能,而云服务提供商则能优化其边缘节点针对协议混淆攻击的缓解策略,增强关键基础设施的韧性。
衍生相关工作
基于H23Q数据集衍生的经典研究包括跨层特征提取方法的优化,如结合TLS握手参数与QUIC帧结构的复合特征工程。多项工作进一步扩展了数据集的攻击变体,例如针对HTTP/3优先级操纵的隐蔽信道检测,以及利用自编码器实现无监督异常检测的轻量化模型。这些成果推动了协议模糊测试工具与自适应防御框架的协同发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作