Draper VDisc Dataset
收藏arXiv2025-09-30 收录
下载链接:
https://osf.io/d45bw/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了C和C++编程语言的函数级别源代码,通过静态分析对这些代码潜在的漏洞进行了标注。为每个函数提供了五种二进制的“漏洞”标签,分别对应于四种最常见的 CWEs(公共弱点枚举)。该数据集的规模包括120,609个非漏洞C函数和1,160个有漏洞的C函数。其任务是进行C源代码的漏洞检测。
This dataset contains function-level source code written in C and C++ programming languages, with potential vulnerabilities in these codes labeled via static analysis. Five binary vulnerability tags are provided for each function, corresponding respectively to the four most common CWEs (Common Weakness Enumerations). The dataset includes 120,609 non-vulnerable C functions and 1,160 vulnerable C functions. The task of this dataset is vulnerability detection for C source code.
提供机构:
Draper
搜集汇总
数据集介绍

背景与挑战
背景概述
Draper VDISC数据集是一个用于源代码漏洞检测的公开数据集,包含从开源软件中挖掘的127万个函数的源代码,每个函数都通过静态分析标记为潜在漏洞。该数据集适用于机器学习、深度学习和自然语言处理等领域的应用,旨在支持软件安全研究和漏洞检测模型的开发。
以上内容由遇见数据集搜集并总结生成



