Dataset|网络安全数据集|API攻击数据集

github2023-12-29 更新2024-05-31 收录

网络安全

API攻击

下载链接：

https://github.com/ptaas-tool/dataset

下载链接

链接失效反馈

资源简介：

该数据集包含了一系列的漏洞和攻击集合。我们收集了一份可能的第7层API攻击列表，并根据给定的漏洞选择了可以执行的攻击。

This dataset comprises a collection of vulnerabilities and attack sets. We have compiled a list of potential Layer 7 API attacks and selected executable attacks based on the given vulnerabilities.

创建时间：

2023-11-18

原始信息汇总

数据集概述

数据集内容

该数据集包含了一系列的漏洞和攻击集合。数据集首先收集了针对API的第七层可能的攻击列表，然后根据存在的漏洞选择了可执行的攻击。

数据集版本

数据集存放在dest目录下，提供多个版本：

v0.1 (simple):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 500
- 数据集文件数: 10
v0.2 (complex):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 5
v0.3 (random):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 10
v0.4 (normal):
- 攻击数: 8
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 1

数据集示例

json [ { "vulnerabilities": [ "sql raw input", "multi source access", "hardcode password" ], "attacks": [ "sql-injection" ] } ]

AI搜集汇总

数据集介绍

构建方式

该数据集的构建过程聚焦于API层面的第七层攻击与漏洞的关联性研究。研究团队首先收集了一系列可能的API攻击方式，随后基于已知的漏洞类型筛选出可实施的攻击手段。通过这一方法，数据集得以系统化地整合攻击与漏洞的对应关系，并以JSON格式进行结构化存储。数据集的多个版本在`dest`目录下提供，每个版本均经过精心设计，以适应不同的研究需求。

特点

该数据集的特点在于其全面覆盖了API层面的第七层攻击与漏洞的关联性。数据集包含多个版本，每个版本在攻击数量、漏洞数量、数据集大小及文件数量上均有所不同，以满足不同研究场景的需求。例如，v0.1版本为简化版，包含9种攻击和112种漏洞，数据集大小为500；而v0.4版本则为标准版，包含8种攻击和112种漏洞，数据集大小为1000。这种多样化的版本设计为研究者提供了灵活的选择空间。

使用方法

该数据集的使用方法简便直观。用户可通过`dest`目录获取不同版本的数据集文件，每个文件均以JSON格式存储，便于直接读取与分析。此外，数据集还提供了扩展功能，用户可通过运行Python脚本`main.py`来添加新的数据。脚本允许用户指定批量导入的数量及每个批次的最大漏洞数量，从而实现对数据集的动态扩展。这种灵活的使用方式为研究者提供了极大的便利。

背景与挑战

背景概述

Dataset数据集聚焦于网络安全领域，特别是针对API的第七层攻击及其相关漏洞的收集与分析。该数据集由网络安全研究人员或机构创建，旨在为API安全研究提供详实的攻击与漏洞数据支持。数据集涵盖了多种常见的攻击类型，如SQL注入等，并详细列出了与之相关的漏洞，如SQL原始输入、多源访问和硬编码密码等。通过不同版本的发布，Dataset逐步扩展了数据规模与复杂性，为网络安全领域的研究与实践提供了重要的数据基础。

当前挑战

Dataset数据集在解决API安全问题的过程中面临多重挑战。首要挑战在于如何准确识别与分类复杂的第七层攻击及其对应的漏洞，这需要深入理解攻击机制与漏洞成因。其次，数据集的构建过程中，研究人员需确保数据的多样性与代表性，以覆盖不同场景下的攻击与漏洞组合。此外，数据集的更新与维护也面临挑战，随着新型攻击手段的不断涌现，数据集需要持续扩展与优化，以保持其时效性与实用性。这些挑战共同构成了Dataset数据集在网络安全领域应用中的核心难题。

常用场景

经典使用场景

在网络安全领域，Dataset数据集被广泛应用于API安全漏洞的检测与防御研究。通过提供一系列已知的第七层攻击和对应的漏洞，该数据集为研究人员和开发者提供了一个标准化的测试平台，用于评估和优化API安全策略。特别是在模拟真实攻击场景时，Dataset能够帮助识别潜在的安全风险，并验证防御机制的有效性。

实际应用

在实际应用中，Dataset数据集被广泛用于企业级API安全测试和漏洞管理。安全团队可以利用该数据集模拟各种攻击场景，评估其API系统的安全性，并针对发现的漏洞进行修复。此外，该数据集还被用于安全培训和教育，帮助开发人员和安全工程师更好地理解API安全威胁，提升其应对能力。

衍生相关工作

基于Dataset数据集，衍生出了多项经典研究工作。例如，研究人员开发了基于机器学习的API漏洞检测模型，利用该数据集进行训练和验证。此外，一些开源安全工具也集成了该数据集，用于自动化漏洞扫描和攻击模拟。这些工作不仅扩展了Dataset的应用范围，还进一步推动了网络安全技术的发展。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4099个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

CACD

跨年龄名人数据集是用于跨年龄人脸识别和检索的数据集。它包含 2,000 位名人的 163,446 张图像。该数据集于 2014 年由马里兰大学计算机科学系发表，论文名为 cross-age Reference Coding for Age-invariant Face Recognition and Retrieval。

OpenDataLab 收录

diegopdlv5/test_dataset_0049c

该数据集主要包含音频数据，分为训练集，共有135个样本，总大小为51580253字节。下载大小为51573551字节。

hugging_face 收录

海天瑞声-超大规模中文多领域高质量多轮对话语料库

这是一个符合中国人表达习惯的自然对话数据集，共计约1,0000,000轮，上亿级token，包含正式&非正式风格对话，使用偏口语化自然表达。覆盖工作、生活、校园等场景，及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上，DOTS-NLP-216包含了对真实场景的对话采集，及高度还原真实场景的模拟对话这两种方式，兼顾分布的代表性、多样性和样本规模。

魔搭社区收录

UniProt

UniProt（Universal Protein Resource）是全球公认的蛋白质序列与功能信息权威数据库，由欧洲生物信息学研究所（EBI）、瑞士生物信息学研究所（SIB）和美国蛋白质信息资源中心（PIR）联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名，整合了实验验证的高质量数据与大规模预测的自动注释内容，涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库（分为人工校验的Swiss-Prot和自动生成的TrEMBL），以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具，为基础研究和药物研发提供了无可替代的支持，成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录