CWEval-v1

Hugging Face2025-11-10 更新2025-11-10 收录

下载链接：

https://huggingface.co/datasets/ShethArihant/CWEval-v1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含安全漏洞信息的数据集，具体包括任务ID、ID、CWE_ID（常见弱点ID）、负面标签、提示信息以及完成信息。提示信息和完成信息都包括内容和角色两个部分。数据集分为python和train两个部分，每个部分包含25个示例。

创建时间：

2025-11-05

原始信息汇总

CWEval-v1 数据集概述

数据集基本信息

数据集名称: CWEval-v1
存储位置: https://huggingface.co/datasets/ShethArihant/CWEval-v1
下载大小: 81,257 字节
数据集大小: 129,472 字节

数据特征结构

task_id: 字符串类型
id: 字符串类型
CWE_ID: 整型（int64）
y_negative: 字符串类型
prompt: 列表结构
- content: 字符串类型
- role: 字符串类型
cot_steps: 字符串类型
completion: 列表结构
- content: 字符串类型
- role: 字符串类型

数据划分

python 划分
- 样本数量: 25
- 数据大小: 74,410 字节
train 划分
- 样本数量: 25
- 数据大小: 55,062 字节

配置文件

配置名称: default
数据文件路径:
- python 划分: data/python-*
- train 划分: data/train-*

搜集汇总

数据集介绍

构建方式

在软件安全分析领域，CWEval-v1数据集通过系统化方法构建，涵盖多种常见弱点枚举（CWE）类型。数据来源于实际代码场景，每个样本包含任务标识、CWE编号及正负示例，采用结构化分割策略，分为Python和训练子集，确保数据多样性和代表性。构建过程注重代码片段的真实性和逻辑完整性，为评估模型在漏洞检测中的表现提供坚实基础。

特点

该数据集以多维度特征著称，包括任务ID、CWE标识、提示内容和完成序列，支持链式思维（CoT）步骤的详细记录。数据规模适中，涵盖25个示例，每个样本通过角色化对话格式呈现，增强了交互性和可解释性。其分割设计便于针对性分析，尤其适合评估代码生成和安全检测模型的鲁棒性，体现了软件工程中漏洞识别的复杂性。

使用方法

使用CWEval-v1时，可加载指定配置如Python或训练分割，直接应用于模型微调或评估任务。数据格式兼容常见框架，通过提示-完成对模拟实际代码审查流程，支持端到端测试。用户可结合CWE_ID和负样本进行对比分析，验证模型在安全弱点识别中的性能，适用于研究或工业场景下的自动化代码审计工具开发。

背景与挑战

背景概述

随着软件安全研究领域的深化，CWE（通用缺陷枚举）分类体系已成为识别软件漏洞的重要基准。CWEval-v1数据集由专业安全研究团队构建，聚焦于通过自然语言处理技术解析代码缺陷模式。该数据集通过结构化对话格式整合漏洞描述与修复方案，旨在建立软件安全与人工智能的交叉研究桥梁，推动自动化代码审计技术的发展。

当前挑战

在软件安全评估领域，核心挑战在于精准识别代码中具有多态性的漏洞模式。CWEval-v1需解决不同编程语言语境下漏洞特征的泛化问题，其构建过程面临标注一致性难题——安全专家需在复杂代码上下文中统一标注标准。同时，对话式数据结构的构建要求平衡技术准确性与自然语言表达的完整性，这对数据质量的把控提出更高要求。

常用场景

经典使用场景

在软件安全分析领域，CWEval-v1数据集作为评估代码漏洞检测模型性能的基准工具，其经典应用场景聚焦于测试大型语言模型对常见弱点枚举（CWE）分类的识别能力。通过提供结构化提示与链式推理步骤，该数据集能够系统验证模型在生成安全代码或识别潜在漏洞时的逻辑一致性，尤其在Python编程语言的语境下，为自动化代码审计研究提供了标准化评估框架。

实际应用

实际应用中，CWEval-v1被集成至持续集成流程，用于监控企业级代码库的潜在安全风险。开发团队可借助该数据集构建自动化扫描工具，实时检测生成代码中的缓冲区溢出、注入攻击等CWE相关漏洞。在教育培训领域，其标注的漏洞案例也成为安全编程课程的重要教学资源，助力提升开发者的安全意识与防御能力。

衍生相关工作

基于CWEval-v1的评估范式，学术界衍生出多项经典研究。例如漏洞检测模型VulBERTa通过迁移学习适配其CWE分类任务，而CodeXGLUE基准则将其扩展为多语言漏洞检测子任务。这些工作不仅深化了对代码语义与安全属性关联的理解，更推动了如SecureCodeGPT等融合安全约束的代码生成模型的迭代发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集