five

Vulnerability Dataset

收藏
github2024-05-15 更新2024-05-31 收录
下载链接:
https://github.com/JoaoRafaelHenriques/CVEDetailsScrapeDataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个全面的安全漏洞信息汇编,从CveDetails网站提取,包含漏洞的类别、CVSS向量版本、影响、CWEs、补丁、受影响的文件、类和函数、SAT工具生成的警报等。

This dataset is a comprehensive compilation of security vulnerability information, extracted from the CveDetails website. It includes categories of vulnerabilities, CVSS vector versions, impacts, CWEs, patches, affected files, classes and functions, as well as alerts generated by SAT tools.
创建时间:
2024-03-11
原始信息汇总

数据集概述

数据集内容

本数据集包含从CveDetails提取的关于安全漏洞的全面信息。数据集组织成多个表格,每个文件包含一个表格或表格的一部分。数据集内容包括漏洞的分类、各版本的CVSS向量、影响、CWEs、补丁、受影响的文件、类和函数、SAT工具生成的警报等。

数据集结构

数据集的结构如下:

  • /PM: 提供用户仅使用数据集一小部分时的信息。
  • /*.sql.gz: 包含每个表格的信息,某些大表格被分割成多个部分。
  • /src: 包含用于数据处理和操作的脚本。
    • join_split_files.sh: 合并分割的转储文件并解压转储目录中的所有压缩文件。
    • insert_*.sh: 将数据插入数据库的脚本。
    • unzip_basic_files: 解压gz文件的脚本。

使用方法

使用本数据集时,用户应根据需求下载相关的转储文件。下载后,需按以下顺序执行src目录中的脚本:

  1. unzip_basic_files.sh
  2. join_split_files.sh
  3. insert_basic_tables.sh
  4. insert_extra_tables.sh
  5. insert_files_tables.sh
  6. insert_classes_tables.sh
  7. insert_functions_tables.sh
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集通过从CveDetails网站提取大量与安全漏洞相关的信息构建而成,涵盖了漏洞的类别、CVSS向量版本、影响、CWE、补丁、受影响的文件、类和函数、以及通过SAT工具生成的警报等详细信息。数据集被组织成多个表格,每个文件包含一个或部分表格,以便于访问和操作。对于较大的表格,数据被分割成多个部分,以确保存储和处理的效率。
特点
该数据集的特点在于其全面性和结构化。它不仅包含了漏洞的基本信息,还涵盖了从CVSS向量到受影响文件的详细数据,为安全研究人员提供了丰富的分析资源。此外,数据集的分割和压缩处理使得其在存储和传输上更为高效,同时提供了多种脚本工具,便于用户进行数据处理和分析。
使用方法
使用该数据集时,用户可以根据需求下载相关的数据文件,并利用提供的脚本工具进行解压和合并操作。具体步骤包括执行解压脚本、合并分割文件、以及将数据插入数据库。这些步骤确保了数据集的完整性和可用性,使得用户能够高效地进行数据分析和研究。
背景与挑战
背景概述
在信息安全领域,漏洞数据的系统化整理与分析对于提升网络安全防护能力至关重要。Vulnerability Dataset 是由 Joao Rafael Henriques 创建并维护的,该数据集从 CveDetails 网站中提取了大量与安全漏洞相关的信息,涵盖了漏洞的类别、CVSS 向量版本、影响程度、CWE 类型、补丁信息、受影响的文件、类和函数,以及通过 SAT 工具生成的警报等。该数据集的构建旨在为研究人员和安全从业者提供一个全面且结构化的漏洞信息资源,以支持漏洞分析、预测和防护策略的制定。通过将数据组织成多个表格,该数据集不仅便于访问和操作,还为深入研究漏洞的复杂性提供了基础。
当前挑战
Vulnerability Dataset 在构建过程中面临了多重挑战。首先,数据来源的多样性和复杂性使得数据的整合与标准化成为一项艰巨任务。其次,由于漏洞数据的规模庞大,如何高效地存储、处理和分析这些数据,尤其是在涉及多个分段文件时,成为了一个技术难题。此外,确保数据的准确性和实时更新也是该数据集面临的挑战之一,因为漏洞信息往往随着新漏洞的发现和修复而迅速变化。最后,如何为不同用户提供灵活的数据访问和处理方式,同时保持数据的一致性和完整性,也是该数据集需要解决的问题。
常用场景
经典使用场景
在信息安全领域,Vulnerability Dataset 被广泛用于漏洞分析与风险评估。该数据集通过整合来自 CveDetails 的详尽漏洞信息,提供了包括漏洞类别、CVSS 向量、影响程度、CWE 类型、补丁信息、受影响的文件及函数等关键数据。研究者可利用这些数据进行漏洞分类、影响评估及威胁建模,从而为安全策略的制定提供科学依据。
实际应用
在实际应用中,Vulnerability Dataset 被广泛应用于企业安全管理、软件开发及政府监管等多个场景。企业可利用该数据集进行漏洞扫描与修复,提升系统安全性;软件开发者则可通过分析受影响文件及函数,优化代码质量,减少潜在风险;政府部门则可借助该数据集进行网络安全监管与政策制定,确保公共安全。
衍生相关工作
基于 Vulnerability Dataset,研究者们开发了多种漏洞分析工具与模型,如漏洞关联分析系统、自动化补丁生成工具及威胁情报平台等。这些衍生工作不仅提升了漏洞管理的效率,还推动了信息安全技术的创新与发展。此外,该数据集还为学术界提供了丰富的研究案例,促进了漏洞挖掘、风险评估及防御策略等领域的深入研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作