claudios/code_x_glue_devign
收藏Hugging Face2024-01-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/claudios/code_x_glue_devign
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: func
dtype: string
- name: target
dtype: bool
- name: project
dtype: string
- name: commit_id
dtype: string
splits:
- name: train
num_bytes: 45723451
num_examples: 21854
- name: validation
num_bytes: 5582533
num_examples: 2732
- name: test
num_bytes: 5646740
num_examples: 2732
download_size: 22289899
dataset_size: 56952724
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 名称:id,数据类型:int32 整数类型
- 名称:func,数据类型:字符串类型
- 名称:target,数据类型:布尔类型
- 名称:project,数据类型:字符串类型
- 名称:commit_id(提交标识符),数据类型:字符串类型
数据集划分:
- 划分名称:训练集(train),占用字节数:45723451,样本数量:21854
- 划分名称:验证集(validation),占用字节数:5582533,样本数量:2732
- 划分名称:测试集(test),占用字节数:5646740,样本数量:2732
下载大小:22289899 字节
数据集总大小:56952724 字节
配置项:
- 配置名称:default(默认配置)
数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
- 对应划分:验证集(validation),文件路径:data/validation-*
- 对应划分:测试集(test),文件路径:data/test-*
提供机构:
claudios
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为
int32 - func: 数据类型为
string - target: 数据类型为
bool - project: 数据类型为
string - commit_id: 数据类型为
string
数据集划分
- train: 包含 21854 个样本,占用 45723451 字节
- validation: 包含 2732 个样本,占用 5582533 字节
- test: 包含 2732 个样本,占用 5646740 字节
数据集大小
- 下载大小: 22289899 字节
- 数据集大小: 56952724 字节
配置信息
- 配置名称: default
- 数据文件路径:
- train:
data/train-* - validation:
data/validation-* - test:
data/test-*
- train:
- 数据文件路径:
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是CodeXGLUE基准中的漏洞检测数据集,包含27,318个代码函数片段,主要来自FFmpeg和qemu项目,用于二元分类任务以识别代码中的漏洞。数据集以文本模态和parquet格式提供,适用于机器学习模型训练和评估。
以上内容由遇见数据集搜集并总结生成



