Dataset|网络安全数据集|API攻击数据集
收藏数据集概述
数据集内容
该数据集包含了一系列的漏洞和攻击集合。数据集首先收集了针对API的第七层可能的攻击列表,然后根据存在的漏洞选择了可执行的攻击。
数据集版本
数据集存放在dest
目录下,提供多个版本:
-
v0.1 (simple):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 500
- 数据集文件数: 10
-
v0.2 (complex):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 5
-
v0.3 (random):
- 攻击数: 9
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 10
-
v0.4 (normal):
- 攻击数: 8
- 漏洞数: 112
- 数据集大小: 1000
- 数据集文件数: 1
数据集示例
json [ { "vulnerabilities": [ "sql raw input", "multi source access", "hardcode password" ], "attacks": [ "sql-injection" ] } ]

CACD
跨年龄名人数据集是用于跨年龄人脸识别和检索的数据集。它包含 2,000 位名人的 163,446 张图像。该数据集于 2014 年由马里兰大学计算机科学系发表,论文名为 cross-age Reference Coding for Age-invariant Face Recognition and Retrieval。
OpenDataLab 收录
diegopdlv5/test_dataset_0049c
该数据集主要包含音频数据,分为训练集,共有135个样本,总大小为51580253字节。下载大小为51573551字节。
hugging_face 收录
海天瑞声-超大规模中文多领域高质量多轮对话语料库
这是一个符合中国人表达习惯的自然对话数据集,共计约1,0000,000轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话这两种方式,兼顾分布的代表性、多样性和样本规模。
魔搭社区 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录