PurCL/marinda-type-inference-debuginfo-only-O1-shuffle
收藏Hugging Face2023-09-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/PurCL/marinda-type-inference-debuginfo-only-O1-shuffle
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
dataset_info:
features:
- name: metadata
struct:
- name: binary_name
dtype: string
- name: function_addr
dtype: int64
- name: function_name
dtype: string
- name: project_name
dtype: string
- name: code_w_type
dtype: string
- name: code
dtype: string
- name: data_dep
dtype: string
splits:
- name: train
num_bytes: 201535867.70075417
num_examples: 37113
- name: test
num_bytes: 22394684.299245823
num_examples: 4124
download_size: 52386440
dataset_size: 223930552.0
---
# Dataset Card for "marinda-type-inference-debuginfo-only-O1-shuffle"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 数据集划分:训练集(train),路径:data/train-*
- 数据集划分:测试集(test),路径:data/test-*
数据集信息:
特征:
- 名称:元数据(metadata),结构体:
- 名称:二进制文件名(binary_name),数据类型:字符串
- 名称:函数地址(function_addr),数据类型:64位整数
- 名称:函数名(function_name),数据类型:字符串
- 名称:项目名(project_name),数据类型:字符串
- 名称:带类型信息的代码(code_w_type),数据类型:字符串
- 名称:代码(code),数据类型:字符串
- 名称:数据依赖(data_dep),数据类型:字符串
数据集划分:
- 名称:训练集(train),总字节数:201535867.70075417,样本数量:37113
- 名称:测试集(test),总字节数:22394684.299245823,样本数量:4124
下载大小:52386440
数据集总大小:223930552.0
---
# "marinda-type-inference-debuginfo-only-O1-shuffle" 数据集卡片
[更多信息需补充](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
PurCL
原始信息汇总
数据集概述
数据集配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 测试集 (
test):data/test-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征信息:
metadata:binary_name:字符串类型function_addr:64位整数类型function_name:字符串类型project_name:字符串类型
code_w_type:字符串类型code:字符串类型data_dep:字符串类型
-
数据分割:
- 训练集 (
train):- 字节数:201,535,867.70075417
- 样本数:37,113
- 测试集 (
test):- 字节数:22,394,684.299245823
- 样本数:4,124
- 训练集 (
-
数据集大小:
- 下载大小:52,386,440 字节
- 数据集大小:223,930,552.0 字节



