five

MITRE-Cyber-Security-CVE-Database|网络安全数据集|漏洞管理数据集

收藏
github2025-04-20 更新2025-04-22 收录
网络安全
漏洞管理
下载链接:
https://github.com/MITRE-Cyber-Security-CVE-Database/mitre-cve-database
下载链接
链接失效反馈
资源简介:
MITRE-Cyber-Security-CVE-Database是一个由企业发起的网络安全倡议,致力于提供一个全面的、开源的管理和跟踪通用漏洞披露(CVE)的平台。该仓库汇总了来自多个权威来源的CVE数据,以支持网络安全专业人士、研究人员和组织。

MITRE-Cyber-Security-CVE-Database is an enterprise-led cybersecurity initiative committed to providing a comprehensive, open-source platform for the management and tracking of Common Vulnerabilities and Exposures (CVEs). The repository aggregates CVE data from multiple authoritative sources to support cybersecurity professionals, researchers, and organizations.
创建时间:
2025-04-16
原始信息汇总

MITRE-Cyber-Security-CVE-Database 数据集概述

数据集简介

  • 名称: MITRE-Cyber-Security-CVE-Database
  • 类型: 网络安全漏洞数据库
  • 创建者: Enterprises
  • 创建时间: 2025年
  • 目的: 提供全面的开源平台,用于管理和跟踪通用漏洞披露(CVE)

关键特性

  • 多源CVE数据: 聚合来自MITRE、NVD、CISA、CVEDetails和Tenable的CVE记录
  • 社区驱动: 开放工具、脚本和文档的贡献
  • 自动更新: 包含脚本以保持与所有数据源的同步

数据来源

  1. MITRE CVE数据库

    • 来源: https://cve.mitre.org
    • 记录数: 超过275,000条CVE条目(截至2024年6月)
    • 目录: cve-data/mitre/
  2. 国家漏洞数据库(NVD)

    • 来源: https://nvd.nist.gov
    • 描述: 包含CVSS分数和CPE适用性的丰富CVE数据
    • 目录: cve-data/nvd/
  3. CISA已知被利用漏洞(KEV)目录

    • 来源: https://www.cisa.gov/known-exploited-vulnerabilities-catalog
    • 描述: 已知在野外被利用的CVE子集
    • 目录: cve-data/cisa-kev/
  4. CVEDetails

    • 来源: https://www.cvedetails.com
    • 描述: 包含漏洞利用和趋势等额外细节的近期CVE
    • 目录: cve-data/cvedetails/
  5. Tenable CVE列表

    • 来源: https://www.tenable.com/cve
    • 描述: 近期CVE的样本(完整列表需要API访问)
    • 目录: cve-data/tenable/

治理原则

  • 数据完整性: CVE数据未经修改地镜像,符合各来源的使用条款
  • 开放访问: 所有数据和工具均可在开源许可下公开访问
  • 社区参与: 鼓励贡献和讨论以改进平台

使用示例

  1. 克隆仓库 bash git clone https://github.com/MITRE-Cyber-Security-CVE-Database/mitre-cve-database.git cd mitre-cve-database

  2. 获取CVE数据 bash chmod +x scripts/fetch-cve-data.sh ./scripts/fetch-cve-data.sh

  3. 搜索特定CVE bash grep -r "CVE-2024-12345" cve-data/mitre/

  4. 解析NVD CVE数据 python import json with open("cve-data/nvd/nvdcve-2025.json", "r") as f: nvd_data = json.load(f) for item in nvd_data["CVE_Items"][:5]: cve_id = item["cve"]["CVE_data_meta"]["ID"] cvss_score = item.get("impact", {}).get("baseMetricV3", {}).get("cvssV3", {}).get("baseScore", "N/A") print(f"CVE ID: {cve_id}, CVSS Score: {cvss_score}")

仓库结构

  • cve-data/: 按提供者组织的CVE数据
    • mitre/: 来自CVEProject/cvelistV5的MITRE CVE数据
    • nvd/: JSON格式的NVD CVE数据
    • cisa-kev/: JSON格式的CISA KEV目录
    • cvedetails/: JSON格式的CVEDetails近期CVE
    • tenable/: 文本格式的Tenable近期CVE样本
  • scripts/: 实用脚本,包括用于同步CVE数据的fetch-cve-data.sh
  • docs/: 使用和贡献文档(即将推出)

许可证

  • CVE数据: 根据各来源的使用条款提供
    • MITRE CVE数据: https://cve.mitre.org/about/termsofuse.html
    • NVD数据: 公共领域(美国政府数据)
    • CISA KEV数据: 公共领域(美国政府数据)
    • CVEDetails和Tenable数据: 在合理使用下用于非商业目的
  • 附加脚本、文档或工具: MIT许可证
AI搜集汇总
数据集介绍
main_image_url
构建方式
在网络安全领域,MITRE-Cyber-Security-CVE-Database通过整合多源权威数据构建了一个全面的漏洞管理平台。该数据集汇集了来自MITRE、NVD、CISA KEV目录、CVEDetails及Tenable等五大核心来源的CVE记录,采用自动化脚本实现数据同步更新。数据以标准化JSON格式存储,并按来源分类归档,确保原始数据的完整性与可追溯性。这种多源聚合的构建模式既保留了各数据源的特性,又通过统一架构提升了数据的可用性。
特点
作为社区驱动的网络安全资源,该数据集最显著的特点是实现了275,000余条CVE记录的跨平台整合。其不仅包含基础漏洞描述,还融合了CVSS评分、已知利用状态等关键元数据。独特的自动化更新机制保障了数据的时效性,而模块化的目录结构设计则支持灵活的数据检索。数据集特别强调对CISA已知被利用漏洞的专项收录,为威胁情报分析提供了高价值子集。
使用方法
用户可通过克隆GitHub仓库快速获取数据集,利用内置的fetch-cve-data.sh脚本实现数据同步更新。数据集采用分层目录结构组织,支持通过grep命令进行快速检索,或使用Python解析JSON格式的漏洞详情。高级用户可配置GitHub Actions实现每日自动更新,而企业级功能如SAML单点登录正在开发中。数据集特别适用于构建漏洞扫描系统、风险评分模型等安全应用场景。
背景与挑战
背景概述
MITRE-Cyber-Security-CVE-Database是由Enterprises于2025年发起的一项网络安全倡议,旨在为管理和跟踪通用漏洞与暴露(CVE)提供一个全面的开源平台。该数据集整合了来自MITRE、美国国家漏洞数据库(NVD)、CISA已知被利用漏洞目录(KEV)、CVEDetails和Tenable等多个权威来源的CVE数据,为网络安全专业人员、研究人员和组织提供了集中化的漏洞管理资源。其核心研究问题在于如何高效整合多源异构的漏洞数据,以支持全球范围内的网络安全防御和漏洞分析。这一数据集的建立显著提升了漏洞信息的可及性和利用效率,对网络安全领域的研究和实践具有重要影响。
当前挑战
MITRE-Cyber-Security-CVE-Database面临的挑战主要包括两个方面。在领域问题方面,该数据集致力于解决多源漏洞数据整合的复杂性,包括数据格式不统一、更新频率不一致以及数据质量参差不齐等问题。在构建过程中,技术挑战尤为突出,例如如何实现自动化数据同步以确保信息的时效性,如何处理大规模异构数据的存储与检索,以及如何在遵守各数据源使用条款的前提下实现数据的合法共享与利用。此外,随着漏洞数量的快速增长,如何维持数据集的完整性和准确性,同时支持高效的查询和分析功能,也是该数据集持续优化的重要方向。
常用场景
经典使用场景
在网络安全领域,MITRE-Cyber-Security-CVE-Database数据集被广泛应用于漏洞管理和威胁情报分析。研究人员和安全专家通过整合多源CVE数据,能够全面掌握已知漏洞的详细信息,包括漏洞类型、影响范围和修复建议。该数据集为漏洞评估和风险管理提供了坚实的基础,特别是在构建自动化漏洞扫描系统和威胁检测平台时,其多源数据整合特性显著提升了分析的准确性和时效性。
解决学术问题
MITRE-Cyber-Security-CVE-Database解决了网络安全研究中数据分散和更新滞后的问题。通过聚合MITRE、NVD、CISA等权威来源的CVE数据,该数据集为学术界提供了标准化、全面的漏洞信息库,支持漏洞模式分析、攻击链建模和风险评估等研究。其开放的社区协作模式进一步推动了漏洞管理技术的创新,为制定更有效的防御策略提供了数据支撑。
衍生相关工作
围绕该数据集,衍生了一系列经典研究工作,例如基于多源CVE数据的漏洞评分模型优化和威胁情报共享平台的开发。部分研究通过机器学习算法分析历史漏洞数据,预测未来可能的攻击趋势。此外,开源社区还构建了多种工具,如CVE数据可视化分析器和自动化补丁推荐系统,进一步扩展了数据集的应用场景。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MeSH

MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。

www.nlm.nih.gov 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录