five

Draper VDisc Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://osf.io/d45bw/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了C和C++编程语言的函数级别源代码,通过静态分析对这些代码潜在的漏洞进行了标注。为每个函数提供了五种二进制的“漏洞”标签,分别对应于四种最常见的 CWEs(公共弱点枚举)。该数据集的规模包括120,609个非漏洞C函数和1,160个有漏洞的C函数。其任务是进行C源代码的漏洞检测。

This dataset contains function-level source code written in C and C++ programming languages, with potential vulnerabilities in these codes labeled via static analysis. Five binary vulnerability tags are provided for each function, corresponding respectively to the four most common CWEs (Common Weakness Enumerations). The dataset includes 120,609 non-vulnerable C functions and 1,160 vulnerable C functions. The task of this dataset is vulnerability detection for C source code.
提供机构:
Draper
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Draper VDISC数据集是一个用于源代码漏洞检测的公开数据集,包含从开源软件中挖掘的127万个函数的源代码,每个函数都通过静态分析标记为潜在漏洞。该数据集适用于机器学习、深度学习和自然语言处理等领域的应用,旨在支持软件安全研究和漏洞检测模型的开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作