five

mistral0105/exebench_io_validated_full

收藏
Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/mistral0105/exebench_io_validated_full
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个字段,涉及函数定义、函数头、函数头类型、文件名、签名、汇编代码、合成依赖、真实依赖、合成输入输出对、真实输入输出对、合成执行包装器、真实执行包装器、参考、合成输入输出规范、真实输入输出规范等。数据集分为训练集,包含17238个样本,文件大小为108226467字节。

The dataset contains multiple fields, including function definitions, function headers, function header types, file names, signatures, assembly code, synthetic dependencies, real dependencies, synthetic input-output pairs, real input-output pairs, synthetic execution wrappers, real execution wrappers, references, synthetic input-output specifications, and real input-output specifications. The dataset is divided into a training set, containing 17,238 samples, with a file size of 108,226,467 bytes.
提供机构:
mistral0105
原始信息汇总

数据集概述

数据集信息

特征

  • path: 字符串类型
  • func_def: 字符串类型
  • func_head: 字符串类型
  • func_head_types: 字符串类型
  • fname: 字符串类型
  • signature: 字符串序列
  • asm: 结构体类型
    • code: 字符串序列
    • target: 字符串序列
  • synth_deps: 字符串类型
  • real_deps: 字符串类型
  • synth_io_pairs: 结构体类型
    • dummy_funcs: 字符串序列
    • dummy_funcs_seed: 整数序列
    • input: 列表
      • value: 字符串序列
      • var: 字符串序列
    • output: 列表
      • value: 字符串序列
      • var: 字符串序列
  • real_io_pairs: 结构体类型
    • dummy_funcs: 空值序列
    • dummy_funcs_seed: 空值序列
    • input: 列表
      • value: 字符串序列
      • var: 字符串序列
    • output: 列表
      • value: 字符串序列
      • var: 字符串序列
  • synth_exe_wrapper: 字符串类型
  • real_exe_wrapper: 字符串类型
  • ref: 字符串类型
  • synth_iospec: 字符串类型
  • real_iospec: 字符串类型

数据分割

  • train:
    • 字节数: 108226467
    • 样本数: 17238

数据集大小

  • 下载大小: 27289886 字节
  • 数据集大小: 108226467 字节

配置

  • default:
    • 数据文件:
      • 分割: train
      • 路径: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作