cve-top100-fr

Hugging Face2026-02-18 更新2026-02-19 收录

下载链接：

https://huggingface.co/datasets/AYI-NEDJIMI/cve-top100-fr

下载链接

链接失效反馈

官方服务：

资源简介：

CVE Top 100（法语版）是一个全面的双语数据集，包含2014年至2024年间100个最严重且被广泛利用的CVE漏洞信息。数据集主要包含三部分内容：1) 100个CVE的详细技术信息，每个条目包含漏洞ID、名称、双语描述（法语/英语）、CVSS评分、严重等级、受影响产品、攻击向量、CWE分类等20余个技术字段；2) 100个教育性问答对（50法语+50英语），涵盖漏洞管理基础知识、漏洞类型、安全管理实践等主题；3) 详细的漏洞统计信息，包括按年份/严重等级分布、活跃漏洞数量等。数据集适用于安全团队漏洞管理、网络安全教育培训以及安全研究等场景，采用JSON和Parquet格式存储，每季度更新一次。数据集遵循CC-BY-4.0许可协议，明确限制仅用于合法教育和研究目的。

创建时间：

2026-02-13

搜集汇总

数据集介绍

构建方式

在网络安全领域，高质量的数据集对于漏洞管理与教育至关重要。CVE Top 100 法语版数据集通过系统化方法构建，精选了2014年至2024年间最具关键性与高利用价值的100个通用漏洞披露条目。其构建过程严格依据公开的漏洞数据库与安全公告，为每个条目整合了详尽的双语技术描述、通用漏洞评分系统评估、影响范围及缓解措施。此外，数据集还精心编制了涵盖漏洞管理基础概念与安全实践的100组双语问答对，并辅以统计摘要，形成了结构清晰、内容完备的教育与研究资源。

特点

该数据集的核心特征在于其高度的专业性与教育实用性。它不仅提供了跨越十年、覆盖多种攻击向量与受影响系统的关键漏洞全景视图，更通过双语内容设计满足了国际化学习需求。每个漏洞条目均包含标准化的元数据字段，如漏洞标识、严重性评分、攻击向量及修复状态，确保了数据的机器可读性与分析便利性。配套的问答内容系统性地涵盖了从基础概念到高级安全管理策略的知识体系，使得数据集既能支持自动化安全工具的训练与评估，也能直接应用于网络安全课程与专业认证培训。

使用方法

该数据集适用于多元化的网络安全应用场景。研究人员可借助其结构化漏洞数据与统计信息进行安全趋势分析与威胁建模。教育工作者可利用其中的双语问答内容构建交互式学习模块或评估工具，用于漏洞管理、渗透测试等课程教学。安全运营团队则可将其作为知识库，辅助漏洞优先级评估、补丁管理决策及事件响应流程的文档参考。数据集以JSON和Parquet格式提供，便于通过编程接口直接加载至数据分析框架或机器学习管道中进行进一步处理与应用开发。

背景与挑战

背景概述

在网络安全领域，漏洞管理与威胁情报分析是保障数字资产安全的核心环节。CVE-Top100-FR数据集由网络安全专家Ayi NEDJIMI及其咨询机构于2024年至2025年间创建，旨在系统化整理2014年至2024年间最具关键性与高利用价值的100个通用漏洞披露条目。该数据集不仅提供详尽的技术细节与多语言问答对，更聚焦于远程代码执行、权限提升等核心安全议题，为漏洞评估、风险优先级划分及安全教育培训提供了结构化知识库，显著推动了自动化威胁分析与教育资源的可及性。

当前挑战

该数据集致力于应对网络安全中漏洞信息分散、更新迅速且理解门槛高的核心问题。其构建挑战在于从海量CVE条目中精准筛选出最具代表性与威胁性的子集，并确保技术描述的准确性与双语一致性。同时，将非结构化的漏洞报告转化为机器可读的标准化格式，并设计兼具教育性与实用性的问答对，需克服领域知识深度与数据标注可靠性的双重考验。

常用场景

经典使用场景

在网络安全研究领域，cve-top100-fr数据集常被用于构建和评估漏洞管理智能系统。该数据集收录了2014至2024年间最具威胁的百个常见漏洞与暴露（CVE）条目，并辅以双语问答对，为自动化漏洞分析提供了结构化知识库。研究人员利用其详尽的元数据，如CVSS评分、攻击向量和缓解措施，训练机器学习模型以识别漏洞模式、预测威胁等级，并辅助安全团队进行风险优先级排序。这种应用不仅提升了漏洞评估的自动化水平，也为构建智能安全运维中心（SOC）工具奠定了数据基础。

解决学术问题

该数据集有效应对了网络安全学术研究中数据稀缺与质量不一的挑战。通过系统化整理十年间的高危漏洞，它为解决漏洞特征工程、威胁情报建模及多语言安全知识表示等关键问题提供了基准。其双语标注结构支持跨语言安全信息检索研究，而标准化的CVE属性字段则促进了漏洞生命周期分析与趋势预测模型的开发。这些贡献显著推动了计算网络安全领域向数据驱动范式的转变，并为评估新型人工智能方法在威胁检测中的应用提供了可靠测试平台。

衍生相关工作

围绕该数据集已衍生出多项创新工具与研究。例如，CVE-Explorer-AI项目利用其语义信息构建了智能漏洞搜索引擎；VulnScanner-LLM则集成大型语言模型进行自动化漏洞扫描与解释。在学术层面，研究者基于其时序漏洞数据开发了预测模型，以研判未来威胁演变趋势。同时，数据集的双语特性激发了跨语言安全问答系统的构建，促进了安全知识在法语社区的普及。这些工作共同扩展了数据集的效用，形成了从基础研究到工程实践的完整创新生态。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集