HttpParamsDataset
收藏github2024-04-26 更新2024-05-31 收录
下载链接:
https://github.com/Morzeux/HttpParamsDataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于评估我的学位论文中的异常检测方法。数据集中的记录代表HTTP请求参数值中可以找到的值。数据集包含超过3100个值,这些值分为两类:良性值(19304项标记为*norm*)和异常值(11763项标记为*anom*)。异常值包括多种攻击类型:SQL注入攻击(10852项标记为*sqli*)、跨站脚本(532项标记为*xss*)、命令注入(89项标记为*cmdi*)和路径遍历攻击(290项标记为*path-traversal*)。数据集是通过使用几个免费资源创建的。
This dataset is used to evaluate the anomaly detection method in my dissertation. The records in the dataset correspond to the values found in HTTP request parameters. The dataset contains over 31,000 values, which are categorized into two classes: benign values (19,304 items labeled *norm*) and anomalous values (11,763 items labeled *anom*). The anomalous values cover multiple attack types: SQL injection attacks (10,852 items labeled *sqli*), cross-site scripting (532 items labeled *xss*), command injection (89 items labeled *cmdi*), and path traversal attacks (290 items labeled *path-traversal*). This dataset was created using several freely available resources.
创建时间:
2016-03-17
原始信息汇总
HttpParamsDataset 概述
数据集用途
本数据集用于评估异常检测方法,特别是在作者的学位论文中。
数据集内容
- 总记录数:超过3100条
- 分类:
- 良性值:19,304项,标记为 norm
- 异常值:11,763项,标记为 anom
- 异常值细分:
- SQL注入攻击:10,852项,标记为 sqli
- 跨站脚本攻击:532项,标记为 xss
- 命令注入攻击:89项,标记为 cmdi
- 路径遍历攻击:290项,标记为 path-traversal
数据集来源
- 良性请求数据:来自 CSIC2010 dataset
- SQL注入样本:使用 sqlmap 生成
- 跨站脚本样本:使用 xssya 生成
- 命令注入和路径遍历样本:使用 Vega Scanner 和 FuzzDB repository 生成
搜集汇总
数据集介绍

构建方式
HttpParamsDataset的构建基于多种公开可用的数据源,旨在评估异常检测方法的有效性。该数据集通过整合CSIC2010数据集中的正常请求参数值,以及利用sqlmap生成SQL注入样本、xssya生成跨站脚本样本、Vega Scanner生成命令注入和路径遍历样本,并辅以FuzzDB仓库中的额外样本,形成了包含超过3100个参数值的综合数据集。这些数据被分为两类:正常值(标记为*norm*)和异常值(标记为*anom*),后者进一步细分为SQL注入、跨站脚本、命令注入和路径遍历等攻击类型。
特点
HttpParamsDataset的显著特点在于其多样性和实用性。数据集不仅涵盖了广泛的应用场景,还通过明确的标签分类,使得研究者能够针对不同类型的网络攻击进行精准的异常检测研究。此外,数据集的规模适中,既保证了数据的丰富性,又便于处理和分析,特别适合用于网络安全领域的实验和模型训练。
使用方法
HttpParamsDataset主要用于网络安全领域的异常检测研究。研究者可以通过加载该数据集,利用其包含的正常和异常HTTP请求参数值,训练和测试各种异常检测算法。数据集的标签结构清晰,便于进行监督学习或半监督学习。此外,由于数据集涵盖了多种攻击类型,研究者还可以针对特定类型的攻击进行深入分析和模型优化,从而提升网络安全防护的精准度和效率。
背景与挑战
背景概述
HttpParamsDataset 是一个用于评估异常检测方法的数据集,由某位研究者在毕业论文中创建。该数据集包含了超过3100个HTTP请求参数值,这些值被分为两类:正常值(标记为*norm*,共19304项)和异常值(标记为*anom*,共11763项)。异常值进一步细分为多种攻击类型,包括SQL注入攻击(标记为*sqli*,10852项)、跨站脚本攻击(标记为*xss*,532项)、命令注入攻击(标记为*cmdi*,89项)和路径遍历攻击(标记为*path-traversal*,290项)。数据集的构建利用了多个公开资源,如CSIC2010数据集、sqlmap、xssya、Vega Scanner和FuzzDB仓库,确保了数据的真实性和多样性。
当前挑战
HttpParamsDataset 面临的挑战主要集中在异常检测的准确性和覆盖范围上。首先,如何有效区分正常值与异常值,尤其是在攻击类型多样且复杂的情况下,是一个关键问题。其次,数据集的构建过程中,如何确保生成的异常值样本具有代表性,同时避免过度拟合或欠拟合,也是一个技术难点。此外,随着网络攻击手段的不断演变,数据集的更新和扩展也成为一个持续的挑战,以确保其能够应对新兴的威胁。
常用场景
经典使用场景
HttpParamsDataset 数据集在网络安全领域中被广泛用于异常检测方法的评估。该数据集包含了超过3100个HTTP请求参数值,分为正常值和异常值两大类。其中,异常值进一步细分为SQL注入、跨站脚本、命令注入和路径遍历等多种攻击类型。通过使用该数据集,研究者和开发者可以有效地训练和测试其异常检测算法,特别是在识别和防御网络攻击方面。
实际应用
在实际应用中,HttpParamsDataset 数据集被广泛用于网络安全产品的开发和测试。例如,防火墙、入侵检测系统和Web应用安全扫描器等工具可以通过该数据集进行性能评估和优化。通过模拟真实的网络攻击场景,这些安全工具能够更准确地识别和防御潜在的威胁,从而保护企业和个人的网络安全。
衍生相关工作
基于HttpParamsDataset 数据集,许多相关的经典工作得以展开。例如,研究者利用该数据集开发了新的异常检测算法,这些算法在识别SQL注入、跨站脚本等攻击方面表现出色。此外,该数据集还被用于验证和改进现有的网络安全模型,推动了网络安全技术的进步。通过这些衍生工作,HttpParamsDataset 数据集在网络安全研究领域产生了深远的影响。
以上内容由遇见数据集搜集并总结生成



